JP2004500019A - Exonuclease-mediated nucleic acid reassembly in directed evolution - Google Patents

Exonuclease-mediated nucleic acid reassembly in directed evolution Download PDF

Info

Publication number
JP2004500019A
JP2004500019A JP2000608795A JP2000608795A JP2004500019A JP 2004500019 A JP2004500019 A JP 2004500019A JP 2000608795 A JP2000608795 A JP 2000608795A JP 2000608795 A JP2000608795 A JP 2000608795A JP 2004500019 A JP2004500019 A JP 2004500019A
Authority
JP
Japan
Prior art keywords
polynucleotide
nucleic acid
exonuclease
polynucleotides
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000608795A
Other languages
Japanese (ja)
Inventor
ショート、ジェイ、エム.
ヤワキシュヴィリ,ソーネ,デイヴィッド
フレイ,ゲルハルド,ジョアン
Original Assignee
ディベルサ コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/276,860 external-priority patent/US6352842B1/en
Priority claimed from US09/332,835 external-priority patent/US6537776B1/en
Application filed by ディベルサ コーポレーション filed Critical ディベルサ コーポレーション
Publication of JP2004500019A publication Critical patent/JP2004500019A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)

Abstract

本発明は、定方向進化(DirectEvolutionTM)の非確率論的方法を使用することにより、新規のポリヌクレオチドおよびコードされたポリペプチドを取得する方法を提供する。エキソヌクレアーゼ仲介再集合法の特に有利な点は、そうしなければキメラ化の際に問題となるであろう核酸鎖を再集合させるその能力である。エキソヌクレアーゼ仲介再集合法は、本明細書中で提供される他の突然変異誘発法と組合わせて使用することができる。これらの方法には、非確率論的ポリヌクレオチド部位飽和突然変異誘発(Gene Site Saturation MutagenesisTM)と非確率論的ポリヌクレオチド再集合(GeneReassemblyTM)が含まれる。本発明は、最適化された物理的および/または生物学的性質をもつ新規酵素を取得する方法を提供する。本発明の方法を用いると、遺伝子ワクチン、酵素、小分子、その他の所望の分子を望ましい性質の方向へと進化させることができる。例えば、遺伝子ワクチンとしての効力が増加しているワクチンベクターが得られる。本方法により得られたベクターは、例えば、抗原発現の増加、細胞への取込みの増加、細胞内安定性の増加、免疫反応を調節する能力などを示し得る。さらに、本発明は、抗生物質、薬物療法およびトランスジェニック形質の分野でさまざまな新規の生物学的活性分子を取得する方法を提供する。The present invention provides methods for obtaining novel polynucleotides and encoded polypeptides by using non-stochastic methods of Directed Evolution . A particular advantage of the exonuclease-mediated reassembly method is its ability to reassemble nucleic acid strands that would otherwise be problematic during chimerization. Exonuclease-mediated reassembly can be used in combination with other mutagenesis methods provided herein. These methods include non-stochastic polynucleotide site saturation mutagenesis (Gene Site Saturation Mutagenesis ) and non-stochastic polynucleotide reassembly (GeneReassembly ). The present invention provides a method for obtaining a novel enzyme having optimized physical and / or biological properties. Using the methods of the present invention, genetic vaccines, enzymes, small molecules, and other desired molecules can be evolved in the direction of desired properties. For example, a vaccine vector having increased efficacy as a gene vaccine is obtained. Vectors obtained by this method can exhibit, for example, increased antigen expression, increased uptake into cells, increased intracellular stability, ability to modulate immune responses, and the like. Further, the present invention provides methods for obtaining a variety of novel biologically active molecules in the fields of antibiotics, drug therapy and transgenic traits.

Description

【0001】
発明の分野
本発明は、タンパク質工学の分野に関する。より具体的には、本発明は、ポリペプチドをコードするポリヌクレオチドを調製するための定方向進化法に関する。この方法は、部位特異的突然変異誘発を発生させる工程(場合によってはポリヌクレオチドをキメラ化する工程と組合せる)、末端選択と呼ばれるプロセスなどによって潜在的に望ましい子孫分子を選択する工程(この後、さらにスクリーニングしてもよい)、および有用な特性を有するポリペプチドの製造のためのポリヌクレオチドをスクリーニングする工程を含む。
【0002】
特定の態様において、本発明は、酵素、特に熱安定性酵素に関し、また定方向進化によるその生成に関する。より詳細には、本発明は、高温で安定であり、また、より低温では改善された活性を有する熱安定性酵素に関する。
【0003】
発明の背景
自然の多様性の完全な可能性の獲得は、発見のステップと、発見されるものを最適化するステップの双方を含み得る。例えば、発見のステップによって、産業上の利用性を有する生物学的分子を利用することが可能となる。しかし、特定の産業上の必要性のためには、これらの酵素を実験的にさらに修飾して、自然の進化がもたらしたものおよび近い将来にもたらすであろうものを越える特性を達成することが有利である。
【0004】
望ましい特性の方へ生物学的分子を実験的に修飾する定方向進化と呼ばれるプロセスは、1つ以上の親分子の鋳型を突然変異させ、子孫分子の中で望ましい分子を同定することによって達成することができる。しかし、定方向進化において現在利用できる技術には、いくつかの欠点がある。これらの欠点とは、以下のようなものである:
1)部位特異的突然変異誘発技術(例えば、雑な又は低い忠実度のPCR)は、ポリペプチド配列に添った各位置(部位)において、完全な(飽和した)範囲の可能な突然変異(すなわち、すべての可能なアミノ酸置換)を体系的に達成するには無効である。
【0005】
2)ある分子配列および潜在的に莫大な数の子孫分子(1以上の分子鋳型の定方向進化により得られうると考えられるもの)内に含まれうる多量の情報を迅速に分析するための比較的容易な体系的手段は存在しない。
【0006】
3)分子位置に関する機能と構造とを関連づける包括的な実験的情報を得るための比較的容易な体系的手段は存在しない。
【0007】
4)特定の突然変異誘発(例えば、キメラ化)法における内部対照(例えば、陽性対照)を取込ませるための容易な体系的手段は存在しない。
【0008】
5)子孫分子(例えば、完全長キメラ)の特定の一群を、より小さな部分配列から選択するための容易な体系的手段は存在しない。
【0009】
分子の突然変異は自然に起こり、特定の産業的応用に有用であることが示された多くの生物学的化合物の生成をもたらした。しかし、自然における進化は、多くの満たされない産業上の必要性と相容れない分子の特性を選択してしまうことも多い。さらに、産業上有用な突然変異が、そうでなければ分子レベルで優先される場合、自然進化が、そのような突然変異の正の選択を凌ぐことは、よく認められることである(例えば、全体として生物に対する悪影響を伴う場合、有利な突然変異が、有害な突然変異を伴う場合)。さらにまた、自然進化は遅く、複製において忠実度に高い力点が置かれている。最後に、自然進化は、主として、有益な突然変異によってできた経路を優先するが、多数の連続した負の突然変異を避ける傾向があり、そのような負の突然変異が、組合された場合に有益となりうる場合、または迂回経路を通って有益な最終状態につながりうる場合であっても、そのような傾向が認められる。
【0010】
一方、定方向進化は、はるかに迅速に生じることが可能であり、自然では得られない産業上望ましい分子特性に進化するように直接的に方向づけられうる。
【0011】
有用なハイブリッドタンパク質を得るためのタンパク質内のアミノ酸、およびこれらのハイブリッドタンパク質をコードするそれらに対応する生物学的分子(すなわち、DNA、RNA)の意図的および無作為な組合せには、非常に多数の可能性が存在する。したがって、所望の用途のための多種多様なそのようなハイブリッドタンパク質(特に、多種多様なランダムタンパク質)を製造しスクリーニングする必要がある。
【0012】
生物学的高分子(例えば、ポリヌクレオチド、ポリペプチド、およびポリヌクレオチドおよびポリペプチド配列の両方を含む分子)の活性な配列の複雑性は、その情報量(「IC」)と称されており、これは、アミノ酸配列の変異に対する該活性タンパク質の抵抗性(同じ機能を有する関連配列のファミリーを表すのに要する不変アミノ酸の最小数(ビット)から計算される)として定義されている。ランダム突然変異誘発に、より感受性であるタンパク質は、高い情報量を有する。
【0013】
分子ライブラリーなどの分子生物学における成果は、非常に多数の可変塩基の同定を可能にしており、ランダムライブラリーから機能的配列を選択するための方法さえも提供している。そのようなライブラリーにおいては、その場合に補償する変化に応じて、ほとんどの残基が変異しうる(尤も、典型的には、同時にすべてというわけではないが)。したがって、100アミノ酸のタンパク質は僅か2,000個の異なる突然変異を含有しうるにすぎないが、20100個の配列の組合せが可能である。
【0014】
情報密度は、配列の単位長さ当たりのICである。酵素の活性部位は高い情報密度を有する傾向にある。これに対して、酵素における情報の柔軟性リンカーは、低い情報密度を有する。
【0015】
ライブラリー形態において代替タンパク質を作製するために広く用いられている現在の方法は、誤りがちなポリメラーゼ連鎖反応およびカセット突然変異誘発であり、この場合、最適化される特定の領域を、合成的に突然変異誘発されたオリゴヌクレオチドで置換する。どちらの場合も、相当数の突然変異部位が、元の配列内の或る部位の周囲に生じる。
【0016】
誤りがちなPCRは、長い配列にわたり低レベルの点突然変異をランダムに導入するために低い忠実度の重合条件を用いる。未知配列の断片の混合物中で、誤りがちなPCRを用いて該混合物を突然変異誘発させることができる。公開されている誤りがちなPCRプロトコールは、ポリメラーゼのプロセシビティーの低さが欠点となる。したがって、該プロトコールは、平均的なサイズの遺伝子のランダム突然変異誘発を行なうことができない。そのため、誤りがちなPCRの実際の適用は制限される。連続した劇的な配列進化に要する大規模なひとまとまりの変化が可能となるには、点突然変異誘発のみでは、しばしば余りにも漸進的すぎることが、いくつかのコンピューターシミュレーションから示唆されている。さらに、公開されている誤りがちなPCRプロトコールは、0.5〜1.0kbを越えるDNA断片を増幅できないため、それらの実際の適用が制限される。また、誤りがちなPCRの反復サイクルは、望ましくない結果(例えば、タンパク質の結合親和性ではなく該タンパク質の免疫原性に対する影響)を有する中立突然変異の蓄積につながりうる。
【0017】
オリゴヌクレオチド誘導突然変異誘発においては、短い配列を、合成的に突然変異誘発されたオリゴヌクレオチドで置換する。このアプローチは、隔たった突然変異の組合せを与えないため、複合的(combinatorial)ではない。非常に長い配列長の割にライブラリーサイズが限られていることは、タンパク質を最適化するのに多数のラウンドの選択が避けられないことを意味する。合成オリゴヌクレオチドでの突然変異誘発においては、各選択ラウンド後に個々のクローンを配列決定し、ついでそれらをファミリーに分類し、必要に応じて、単一のファミリーを選択し、それをコンセンサスモチーフに変換することが必要である。そのようなモチーフを再合成し、単一遺伝子内に再挿入し、ついで追加的な選択を行なう。この工程は統計的な障害となり、労働集約的であり、多ラウンドの突然変異誘発には実用的でない。
【0018】
このように、誤りがちなPCRおよびオリゴヌクレオチド誘導突然変異誘発は、単一サイクルの配列微調整には有用であるが、多サイクルに適用されると急に限定的なものとなる。
【0019】
誤りがちなPCRのもう1つの制約は、ダウン突然変異(down−mutations)の速度が配列の情報量と共に増加することである。情報量、ライブラリーサイズおよび突然変異誘発速度が増加するにつれて、アップ突然変異(up−mutations)とダウン突然変異との平衡が、さらなる改善の選択を統計的に妨げるであろう(統計的な頭打ち)。
【0020】
カセット突然変異誘発においては、単一の鋳型の配列のブロックを、典型的には、(部分的に)ランダム化された配列で置換する。したがって、得られうる最大の情報量は、ランダムな配列の数(すなわち、ライブラリーサイズ)により統計的に制限される。これは、現在では最良ではないが長期的にはより大きな潜在性を有する他の配列ファミリーを排除する。
【0021】
また、合成オリゴヌクレオチドでの突然変異誘発は、各選択ラウンド後に個々のクローンの配列決定を要する。したがって、そのようなアプローチは面倒であり、多ラウンドの突然変異誘発には実用的でない。
【0022】
したがって、比較的低い情報量の微調整領域には、誤りがちなPCRおよびカセット突然変異誘発が最も適しており、広く用いられている。1つの明らかな例外は、誤りがちなPCRおよび選択による多ラウンドの増幅を用いるランダムライブラリーからのRNAリガーゼリボザイムの選択である。
【0023】
自然界においては、ほとんどの生物の進化は自然選択および有性生殖により生じる。有性生殖は、選択された個体の子孫における遺伝子の混合および組合せを保証するものである。減数***の間に、親由来の相同染色体が互いに整列し、それらの長さに沿った一部が交差し、それにより遺伝物質をランダムに交換する。DNAのそのような交換またはシャッフリングは、生物がより迅速に進化するのを可能にする。
【0024】
組換えにおいては、挿入される配列は、相同な環境中で有用であると判明しているものであるため、該挿入配列は、それらが新たな配列内に挿入されたら、尚も相当な情報量を有すると考えられる。
【0025】
「応用分子進化」(Applied Molecular Evolution,「AME」)という用語は、特定の有用な目標に対する進化設計アルゴリズムの応用を意味する。AMEのための多数の異なるライブラリーフォーマットがポリヌクレオチド、ペプチドおよびタンパク質(ファージ、lacIおよびポリソーム)について報告されているが、これらのフォーマットはどれもコンビナトリアルライブラリーを意識的に作製するためのランダム乗換え(cross−over)による組換えに対応したものではない。
【0026】
理論的には、100アミノ酸のタンパク質には2,000個の異なる単一突然変異体が存在する。しかしながら、100アミノ酸のタンパク質は20100個の可能な配列の組合せを有し、通常の方法で徹底的に検討するには、この数は余りに膨大である。これらの可能な組合せ突然変異のすべての生成およびスクリーニングを可能にする系を開発するのが好都合であろう。
【0027】
当技術分野における幾人かの研究者は、ファージ系内での発現のための軽鎖抗体遺伝子と重鎖抗体遺伝子との組合せのハイブリッドを作製するために、in vivo部位特異的組換え系を利用している。しかしながら、それらの系は、特定の組換え部位に基づくものであり、それに応じて限定されてしまう。重複伸長およびPCRによる一本鎖抗体(scFV)内の抗体CDR領域の同時突然変異誘発が報告されている。
【0028】
他の研究者は、ランダムin vivo組換えを用いて多数のハイブリッドの大きな集団を作製する方法を記載している。この方法は、2つの異なるプラスミドライブラリー(各ライブラリーは異なる選択マーカーを有する)の組換えを要する。この方法は、存在する選択マーカーの数に等しい限られた数の組換えに限定されてしまい、選択された配列に結合したマーカー遺伝子の数の直線的増加を伴う。
【0029】
プラスミド上の相同ではあるが末端切断型である2つの昆虫毒素遺伝子間のin vivo組換えが、ハイブリッド遺伝子の製造方法として報告されている。欠損したミスマッチ修復酵素を有する宿主細胞内での実質的にミスマッチしたDNA配列のin vivo組換えによるハイブリッド分子の形成が報告されている。
【0030】
発明の概要
本発明は、概して、核酸工学、およびそれに対応してコードされる組換えタンパク質工学の分野に関する。さらに具体的には、本発明は、核酸の定方向進化、ならびに、その結果生じる関心のある活性(例えば、関心のある核酸活性および/または特定のタンパク質(特に酵素)の活性)に基づいて進化させた核酸を含むクローンのスクリーニングに関する。
【0031】
本発明は、概して、1) 1つ以上の先祖または親世代の鋳型から、少なくとも1つの点突然変異、付加、欠失および/またはキメラ化を達成するように突然変異を起こしている子孫世代の分子(ポリヌクレオチド配列からなる分子、ポリペプチド配列からなる分子、および一部がポリヌクレオチド配列からなり一部がポリペプチド配列からなる分子を含む)を調製し;2) 該子孫世代の分子を、好ましくはハイスループット法を用いて、少なくとも1つの関心のある特性(酵素活性の向上または安定性の増大または新規な化学療法上の効果など)に関してスクリーニングし;3) 場合により、該親および/または子孫世代の分子に関する構造的および/または機能的な情報を取得および/または分類し;そして、4) 場合により、任意のステップ1)〜3)を繰り返す、方法に関する。
【0032】
好ましい実施形態において、本発明は、突然変異させた子孫ポリヌクレオチドの作製方法であって、
(a) 出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製する、
これにより、エキソヌクレアーゼ仲介再集合プロセスは、3’アンダーハングおよび平滑末端に作用する3’エキソヌクレアーゼで処理(例えば、エキソヌクレアーゼIIIを用いて処理)し、出発二本鎖ポリヌクレオチドから5’末端ではなく3’末端のヌクレオチドを遊離させ、部分的もしくは完全にその元の相手を含まない残った鎖を残存させることにより、非限定的な様式で例示され、所望であれば、残った鎖を、別の相手とのハイブリダイゼーションを達成するために使用することができ、;
これにより、エキソヌクレアーゼ仲介再集合プロセスがさらに、5’アンダーハングに作用する5’エキソヌクレアーゼで処理(例えば、レッドアルファ遺伝子産物を用いて処理)することにより、出発二本鎖ポリヌクレオチドから5’末端のヌクレオチドを遊離させ、部分的もしくは完全にその元の相手を含まない残った鎖を残存させることにより、非限定的な様式で例示され、所望であれば、残った鎖を、別の相手とのハイブリダイゼーションを達成するために使用することができ、;
これにより、エキソヌクレアーゼ仲介再集合プロセスがさらに、ハイブリダイズしていない末端等のオーバーハング末端に作用するエキソヌクレアーゼで処理(例えば、Mung Bean NucleaseまたはS1ヌクレアーゼまたは大腸菌DNAポリメラーゼを用いて処理)することにより、ヘテロ核酸複合体(heteromeric nucleic acid complex)中のアニーリングさせた核酸鎖のハイブリダイズしていない一本鎖末端から末端ヌクレオチドを遊離させ、短くされているがハイブリダイズした末端を残存させることにより処理末端のポリメラーゼに基づく伸長および/またはリガーゼ仲介型連結を促進する、ことにより非限定的な様式で例示され、;
さらにこれにより、エキソヌクレアーゼ仲介再集合プロセスが、例えば、アンダーハング末端もしくは平滑末端から末端ヌクレオチドを遊離させるエキソヌクレアーゼおよびハイブリダイズしていない末端等のオーバーハング末端から末端ヌクレオチドを遊離させるエキソヌクレアーゼの両方を同時ではなく用いることにより実施することができる二重処理によっても例示される;
ことを含んでなる前記方法である。
【0033】
本実施形態の好ましい態様において、本発明は、突然変異させた子孫ポリヌクレオチドを生成するための方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットを3’アンダーハングおよび平滑末端に作用する3’エキソヌクレアーゼで処理して、5’末端ではなく3’末端のヌクレオチドを遊離させる、
これにより、該3’エキソヌクレアーゼは、エキソヌクレアーゼ(例えば、エキソヌクレアーゼIII)で処理し、出発二本鎖ポリヌクレオチドから5’末端ではなく3’末端のヌクレオチドを遊離させ、部分的もしくは完全にその元の相手を含まない残った鎖を残存させることにより、非限定的な様式で例示され、所望であれば、残った鎖を別の相手とのハイブリダイゼーションを達成するために使用することができる;
からなる前記方法を提供する。
【0034】
本実施形態の別の好ましい態様において、本発明は、突然変異させた子孫ポリヌクレオチドを作製するための方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットを5’アンダーハングに作用する5’エキソヌクレアーゼで処理して、5’末端のヌクレオチドを遊離させること、
これにより、該5’エキソヌクレアーゼは、エキソヌクレアーゼ(例えば、レッドアルファ遺伝子産物)で処理し、出発二本鎖ポリヌクレオチドから5’末端のヌクレオチドを遊離させ、部分的もしくは完全にその元の相手を含まない残った鎖を残存させることにより、非限定的な様式で例示され、所望であれば、残った鎖を別の相手とのハイブリダイゼーションを達成するために使用することができる;
からなる前記方法を提供する。
【0035】
本実施形態のさらに別の好ましい態様において、本発明は、突然変異させた子孫ポリヌクレオチドを作製するための方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットをエキソヌクレアーゼで処理して、核酸のオーバーハングから末端のヌクレオチドを遊離させること、
これにより、該処理は、ハイブリダイズしていない末端等のオーバーハング末端に作用するエキソヌクレアーゼで処理(例えば、Mung Bean NucleaseまたはS1ヌクレアーゼまたは大腸菌DNAポリメラーゼを用いて処理)することにより、ヘテロ核酸複合体中のアニーリングさせた核酸鎖のハイブリダイズしていない一本鎖末端からヌクレオチドを遊離させ、短くされているがハイブリダイズした末端を残存させることにより処理末端のポリメラーゼに基づく伸長および/またはリガーゼ仲介型連結を促進する、ことにより非限定的な様式で例示される;
からなる前記方法を提供する。
【0036】
本実施形態のさらに別の好ましい態様において、本発明は、突然変異させた子孫ポリヌクレオチドを作製するための方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットを3’アンダーハングおよび平滑末端に作用する3’エキソヌクレアーゼで処理して、5’末端ではなく3’末端のヌクレオチドを遊離させること、および
(ii) 出発または親ポリヌクレオチドのセットをエキソヌクレアーゼで処理して、核酸のオーバーハングから末端のヌクレオチドを遊離させること、
からなり、
これにより、前記エキソヌクレアーゼ仲介再集合プロセスが、例えば、アンダーハング末端もしくは平滑末端から末端ヌクレオチドを遊離させるエキソヌクレアーゼおよびハイブリダイズしていない末端等のオーバーハングから末端ヌクレオチドを遊離させるエキソヌクレアーゼの両方を同時ではなく用いることにより実施することができる二重処理である、前記方法を提供する。
【0037】
本実施形態のさらに別の好ましい態様において、本発明は、突然変異させた子孫ポリヌクレオチドを作製するための方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットを5’アンダーハングに作用する5’エキソヌクレアーゼで処理して、5’末端のヌクレオチドを遊離させること、および
(ii) 出発または親ポリヌクレオチドのセットをエキソヌクレアーゼで処理して、核酸のオーバーハングから末端のヌクレオチドを遊離させること、
からなり、
これにより、前記エキソヌクレアーゼ仲介再集合プロセスが、例えば、アンダーハング末端もしくは平滑末端から末端ヌクレオチドを遊離させるエキソヌクレアーゼおよびハイブリダイズしていない末端等のオーバーハングから末端ヌクレオチドを遊離させるエキソヌクレアーゼの両方を同時ではなく用いることにより実施することができる二重処理である、前記方法を提供する。
【0038】
別の好ましい実施形態において、本発明は、少なくとも1つの所望の特性を有する突然変異させた子孫ポリヌクレオチドを作製するための方法であって、
(a) 出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製し、そして
(b) 子孫ポリヌクレオチドのセットを末端選択に基づくスクリーニングおよび富化プロセスに付すことにより、子孫ポリヌクレオチドの所望のサブセットを選択する、
これにより、上記工程は反復して、またどんな順序、組合わせで行うこともでき;
これにより、末端選択に基づくプロセスにより連結に適合する末端を作製し;
これにより、集合および/または再集合的突然変異誘発を達成するために、任意で連結に適合する末端の作製を利用して子孫ポリヌクレオチドのセットのメンバー内での1以上の分子間連結(好ましくは定方向の連結)を促進し、;
これにより、連結に適合する末端作製は子孫ポリヌクレオチドのセットの発現ベクター系への連結および発現クローニングを促進するのに役立ち、;
これにより、前記子孫ポリヌクレオチドのセットの発現クローニングはポリペプチドのセットを生成させるのに役立ち、;
これにより、生成されたポリペプチドのセットを発現スクリーニングプロセスに付すことができ、;そして
これにより、子孫ポリペプチドのセットの発現スクリーニングは、所望の特性(例えば、特異的酵素活性)を有する所望の分子種(例えば、突然変異ポリペプチドまたはポリペプチド断片)を同定する手段を提供する;
ことからなる前記方法を提供する。
【0039】
別の好ましい実施形態において、本発明は、先祖ポリヌクレオチドのコレクションから突然変異させた子孫ポリヌクレオチドを生成する方法であって、
(a) 1本の多結合核酸鎖を2本の単一結合核酸鎖にアニーリングすることにより、アニーリングさせた核酸鎖ヘテロ複合体を生成し、
ここで1本の多結合核酸鎖および2本の単一結合核酸鎖は、それぞれ前記先祖ポリヌクレオチドのコレクション中の異なる分子種に由来するものであり、;
ここで前記先祖ポリヌクレオチドのコレクションは、好ましくは、デハロゲナーゼをコードする遺伝子のコレクションにより例示されるような、同一ではないが関連する可能性のある複数の子孫ポリヌクレオチドからなり、;
さらにここで1本の多結合核酸鎖および2本の単一結合核酸鎖は、それぞれそれらが由来する先祖ポリヌクレオチドと同一の、少なくとも7ヌクレオチド長の配列を有し、;
(b) 前記へテロ複合体中のアニーリングさせた単一結合核酸鎖のハイブリダイズしていない一本鎖末端をエキソヌクレアーゼ処理に付すことにより、そのハイブリダイズしていない一本鎖末端を分解する、
これにより、同一ではないポリヌクレオチドに由来する実施多結合鎖および単一結合鎖のアニールメントにより、その後に前記の同一ではないポリヌクレオチドのキメラ化を生じさせることが可能となり、;
これにより、前記のアニーリングさせた核酸鎖複合体のライブラリー中で、多くの成分鎖はポリメラーゼに基づく伸長をプライミングするには至適でないまたは役に立たない、ハイブリダイズすることができない末端を有し、;そして
これにより、エキソヌクレーゼ処理によりそうしたハイブリダイズできない末端を除去し、アニーリングさせた核酸鎖複合体をポリメラーゼに基づく伸長により適したプライマーに変換する;
ことを含んでなる前記方法。
【0040】
本実施形態の好ましい態様において、本発明は、先祖ポリヌクレオチドのコレクションから突然変異させた子孫ポリヌクレオチドを生成する方法であって、下記ステップ(c):
(c) アニーリングさせたヘテロ複合体をポリメラーゼに基づく伸長に付すこと、
をさらに含んでなる、前記方法を提供する。
【0041】
本実施形態の別の好ましい態様において、本発明は、先祖ポリヌクレオチドのコレクションから突然変異させた子孫ポリヌクレオチドを生成する方法であって、下記ステップ(d):
(d) アニーリングさせた核酸鎖をリガーゼ処理に付す、
これにより、リガーゼ処理は、2本のアニーリングさせた単一結合鎖間の分子間連結を達成してそれにより共有結合により連結されたキメラ化鎖を形成するために、T4 DNAリガーゼ処理に付すことにより例示される;
ことをさらに含んでなる、前記方法を提供する。
【0042】
本実施形態のさらに別の好ましい態様において、本発明は、先祖ポリヌクレオチドのコレクションから突然変異させた子孫ポリヌクレオチドを生成する方法であって、下記ステップ(e):
(e) 連結した単一結合核酸鎖(mono−binding nucleic acid strand)から多結合核酸鎖(poly−binding nucleic acid strand)を分離する、
これにより、多結合核酸鎖がアニーリングした連結した単一結合核酸鎖からの該多結合核酸鎖の分離は、例えば、変性または多結合核酸鎖に選択的に作用する酵素活性への暴露のいずれかによって達成することができる;
ことをさらに含んでなる、前記方法を提供する。
【0043】
本実施形態のさらに別の好ましい態様において、本発明は、先祖ポリヌクレオチドのコレクションから突然変異させた子孫ポリヌクレオチドを生成する方法であって、下記ステップ(f):
(f) 連結された単一結合核酸鎖に相補的な核酸鎖を生成する、
これにより、得られる産物は二本鎖の突然変異させた子孫ポリヌクレオチドからなる;
ことをさらに含んでなる、前記方法を提供する。
【0044】
本実施形態のさらに別の好ましい態様において、本発明は、先祖ポリヌクレオチドのコレクションから突然変異させた子孫ポリヌクレオチドを生成する方法であって、かかる突然変異させた子孫ポリヌクレオチドが遺伝子または遺伝子経路である前記方法を提供する。
【0045】
本実施形態のさらに別の好ましい態様において、本発明は、先祖ポリヌクレオチドのコレクションから突然変異させた子孫ポリヌクレオチドを生成する方法であって、生成された突然変異させた子孫ポリヌクレオチドを適切な宿主中で発現させることをさらに含み、ここで前記発現が発現スクリーニングにより検出され得るポリペプチド産物の生成をもたらすものである前記方法を提供する。
【0046】
好ましい実施形態において、(例えば、親ポリヌクレオチド鋳型から)−「コドン部位飽和突然変異誘発」と名付けられたものにおいて−子孫世代のポリヌクレオチドであって、該ポリヌクレオチドの各々が、全てのコドン(または、同一のアミノ酸をコードする縮重コドンの全てのファミリー)が各コドン位置に呈示されるように、少なくとも1セットで3つ以下の隣接する点突然変異(すなわち、新規なコドンを含む異なる塩基)を有する、該子孫世代のポリヌクレオチドが生成される。この子孫世代のポリヌクレオチドに対応して−およびこの子孫世代のポリヌクレオチドによりコードされるものとして−、それぞれが少なくとも1つの単一アミノ酸点突然変異を有する子孫ポリペプチドが1セット生成される。好ましい態様において、−「アミノ酸部位飽和突然変異誘発」と名付けられたものにおいて−該ポリペプチドに沿った各および全てのアミノ酸位置に、19種の天然にコードされるポリペプチド形成α−アミノ酸置換の各々に対して1つの突然変異ポリペプチドがもたらされる。これにより、−該親ポリペプチドに沿った各および全てのアミノ酸位置において−元々のアミノ酸を含む全部で20種の異なる子孫ポリペプチド、または該20種の天然にコードされるアミノ酸の代わりに、もしくはそれに加えて別のアミノ酸が用いられた場合には、21種より多い異なる子孫ポリペプチドが得られることもある。
【0047】
したがって、別の態様において、この方法はまたは、−上記20種の天然にコードされるポリペプチド形成α−アミノ酸に加えて、および/またはそれらと組合せて−他の稀な、および/または天然にコードされないアミノ酸およびアミノ酸誘導体をふくむ突然変異体を生成するのに用い得る。さらに別の態様において、この方法はまた、(例えば、1つ以上の改変tRNA分子を有する宿主細胞内で)−好適な宿主の天然または未改変のコドン認識系に加えて、および/またはそれらと組合せて−改変コドン認識系、突然変異コドン認識系および/または設計コドン認識系を用いることにより、突然変異体を生成するのにも用い得る。
【0048】
さらに別の態様において、本発明は、組換え、さらに詳細には、部分的に相同な領域を含むポリヌクレオチド配列のin vivo再組合せ(re−assortment)の方法によりポリペプチドをコードするポリヌクレオチドを調製し、該ポリヌクレオチドを再集合させて少なくとも1つのポリヌクレオチドを形成し、該ポリヌクレオチドを、有用な特性を有するポリペプチドの生成に関してスクリーニングする方法に関する。
【0049】
さらに別の好ましい実施形態において、本発明は、達成される任意の突然変異的変化(特に飽和突然変異誘発を含む)の効果を−任意の分子特性(例、酵素活性)または現行の技法により可能な特性の組合せについて−分析および分類するのに用い得る。したがって、親ポリペプチド中の各アミノ酸を少なくとも19種の可能性のある置換物の各々に変える効果を調べるための包括的な方法が提供される。このことにより、親ポリペプチド中の各アミノ酸が、該ポリペプチドの測定可能な特性に及ぼす潜在的効果の範囲にしたがって、特性決定でき、そして分類できるようになる。
【0050】
別の態様において、本発明の方法は、分子同士を再結合させ、ならびに/または配列の複雑度および相同領域を有する反復配列もしくは連続配列の程度を低下させる減少性プロセス(reductive processes)を仲介する、という細胞の生来の特性を利用する。
【0051】
本発明の目的とするところは、増大した活性を有する生物学的に活性なハイブリッドポリペプチドをコードするハイブリッドポリヌクレオチドを生成する方法を提供することである。本発明の1つの態様によれば、これらおよび他の目的を達成する上で、ポリヌクレオチドを適切な宿主細胞に導入し、ハイブリッドポリヌクレオチドを生成する条件下で該宿主細胞を増殖させるための方法が提供されている。
【0052】
本発明の別の態様において、本発明は、ハイブリッドポリヌクレオチドによりコードされる生物学的に活性なハイブリッドポリペプチドをスクリーニングするための方法を提供する。この方法は、増大した生物学的活性を有する生物学的に活性なハイブリッドポリペプチドの同定を可能にする。
【0053】
本発明の他の目的、特徴および利点は、以下の詳細な説明から当業者には明らかとなろう。しかしながら、以下の詳細な説明および特定の実施例は、本発明の好ましい実施形態を示してはいるが、これらは単に例示目的で与えられるものである。何故なら、本発明の思想および範囲内の種々の変更および変形は、本明細書中の詳細な記載から当業者には明らかとなるからである。
【0054】
特定の実施形態において、本発明は、少なくとも1つの所望の特性を有する子孫ポリヌクレオチドのライブラリーを作製し単離するための方法であって、
(a) 出発または親ポリヌクレオチドのセットを突然変異誘発プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製し、そして
(b) この子孫ポリヌクレオチドのセットを末端選択に基づくスクリーニングおよび富化プロセスに付すことにより、子孫ポリヌクレオチドの所望のサブセットを選択する、
これにより、上記工程は反復して、またどんな順序、組合わせで行うこともでき;
これにより、末端選択に基づくプロセスにより連結に適合する末端を作製し;
これにより、集合および/または再集合的突然変異誘発を達成するために、任意で連結に適合する末端の作製を利用して子孫ポリヌクレオチドのセットのメンバー内での1以上の分子間連結(好ましくは定方向の連結)を促進し、;
これにより、連結に適合する末端作製は子孫ポリヌクレオチドのセットの発現ベクター系への連結および発現クローニングを促進するのに役立ち、;
これにより、末端選択に基づくスクリーニングおよび富化プロセスにより、突然変異誘発プロセス(例えば、非確率論的ポリヌクレオチド部位飽和突然変異誘発(Gene Site Saturation MutagenesisTM)および非確率論的ポリヌクレオチド再集合(GeneReassemblyTM))により生成した子孫ポリヌクレオチドのライブラリーを作製することが可能となり、;
これにより、前記子孫ポリヌクレオチドのセットの発現クローニングは全長ポリペプチドのセットを生成するのに役立ち、;
これにより、生成されたポリペプチドのセットを発現スクリーニングプロセスに付すことができ、;そして
これにより、子孫ポリペプチドのセットの発現スクリーニングは、所望の特性(例えば、特異的酵素活性)を有する所望の分子種(例えば、突然変異ポリペプチドまたはポリペプチド断片)を同定する手段を提供する;
ことからなる前記方法を提供する。
【0055】
別の特定の実施形態において、本発明は、少なくとも1つの所望の特性を有する子孫ポリヌクレオチドのライブラリーを作製し単離するための方法であって、
(a) 出発または親ポリヌクレオチドのセットを突然変異誘発プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製し、そして
(b) この子孫ポリヌクレオチドのセットを末端選択に基づくスクリーニングおよび富化プロセスに付すことにより、子孫ポリヌクレオチドの所望のサブセットを選択する、
これにより、上記ステップは反復して、またどんな順序、組合わせで行うこともでき;
これにより、末端選択に基づくプロセスにより連結に適合する末端を作製し;
これにより、集合および/または再集合的突然変異誘発を達成するために、任意で連結に適合する末端の作製を利用して子孫ポリヌクレオチドのセットのメンバー内での1以上の分子間連結(好ましくは定方向の連結)を促進し、;
これにより、末端選択に基づくスクリーニングおよび富化プロセスにより、突然変異誘発プロセス(例えば、非確率論的ポリヌクレオチド部位飽和突然変異誘発(Gene Site Saturation MutagenesisTM)および非確率論的ポリヌクレオチド再集合(GeneReassemblyTM))により生成した子孫ポリヌクレオチドのライブラリーを作製することが可能となり、;
これにより、前記子孫ポリヌクレオチドのセットの発現クローニングは全長ポリペプチドのセットを生成するのに役立ち、;
これにより、連結に適合する末端作製は子孫ポリヌクレオチドのセットの発現ベクター系への連結および発現クローニングを促進するのに役立ち、;
これにより、生成されたポリペプチドのセットを発現スクリーニングプロセスに付すことができ、;そして
これにより、子孫ポリペプチドのセットの発現スクリーニングは、所望の特性(例えば、特異的酵素活性)を有する所望の分子種(例えば、突然変異ポリペプチドまたはポリペプチド断片)を同定する手段を提供する;
ことからなる前記方法を提供する。
【0056】
本実施形態の特定の態様において、本発明は、先に記載した方法であって、ステップ(a)の突然変異誘発プロセスが、コドン含有親ポリペプチド鋳型から単一のアミノ酸置換の全範囲が各アミノ酸の位置で表される子孫ポリペプチドのセットを生成するための飽和突然変異誘発と称されるプロセスからなり、
(a) 実施コドン含有鋳型ポリヌクレオチドを、突然変異を起こそうとする各コドンのための縮重オリゴヌクレオチドを用いてポリメラーゼに基づく増幅に付すことにより子孫ポリヌクレオチドのセットを生成し、ここで、縮重オリゴヌクレオチドのそれぞれは第1相同配列と縮重トリプレット配列とからなり、
ここで縮重トリプレット配列はi)N,N,N、ii)N,N,G/T、iii)N,N,G/C、iv)N,N,C/G/T、v)N,N,A/G/T、vi)N,N,A/C/T、vii)N,N,A/C/G、およびviii)全20種のアミノ酸をコードする任意の縮重コドンよりなる群から選択され、そして
b) 子孫ポリヌクレオチドのセットを組換え発現に付すことにより、該子孫ポリヌクレオチドによりコードされるポリペプチドを産生させる、
ことを含んでなり、
これにより、前記ステップは、反復して、またどんな順序、組合わせで行うこともでき、そして
これにより、トリプレット配列の縮重は全20種のアミノ酸のコドンを含むことから、前記方法は親ポリペプチド鋳型に沿った各アミノ酸部位に全20種のアミノ酸の変化をもたらす手段を提供する。
【0057】
本実施形態の特定の態様において、本発明はさらに、先に記載した方法であって、ステップ(a)の突然変異誘発プロセスが合成連結遺伝子再集合または単純合成連結遺伝子再集合と称されるプロセスからなる前記方法を提供する。
【0058】
用語の定義
本明細書に記載した実施例の理解を容易にするために、一定の頻繁に用いられる方法および/または用語を説明する。
【0059】
「作用物質(agent)」という用語は、本明細書で用いられる場合、化合物、化合物の混合物、空間的に局在化した化合物のアレイ(例えば、VLSIPSペプチドアレイ)、ポリヌクレオチドアレイ、および/またはコンビナトリアル小分子アレイ)、生物学的巨大分子、バクテリオファージペプチド展示ライブラリー、バクテリオファージ抗体(例えばscFv)展示ライブラリー、ポリソームペプチド展示ライブラリー、または生物材料、例えば細菌細胞、植物細胞、真菌細胞、または動物(特に哺乳動物)細胞または組織などからの抽出物を示すものである。作用物質は、下記のスクリーニングアッセイに組み込まれることにより、抗腫瘍剤、抗炎症剤またはアポトーシスモジュレーターとしての潜在的な活性について評価される。作用物質は、下記のスクリーニングアッセイに組み込まれることにより、特異的なタンパク質相互作用インヒビター(すなわち、2つの所定のポリペプチド間の結合相互作用を選択的に阻害するが、実質的に細胞生存を妨害しない作用物質)としての潜在的な活性について評価される。
【0060】
制限部位における「多義的塩基要求(ambiguous base requirement)」とは、完全に指定されていない、すなわち、1つの特定の塩基(例えば、限定するものではないが、A、C、GおよびTから選択される特定の塩基など)ではなく、少なくとも2個以上の塩基のうちのいずれか1つであり得るヌクレオチド塩基要求を意味する。当技術分野および本明細書で塩基の多義性を示すために用いられる一般に許容されている略語は下記のとおりである:R=GまたはA;Y=CまたはT;M=AまたはC;K=GまたはT;S=GまたはC;W=AまたはT;H=AまたはCまたはT;B=GまたはTまたはC;V=GまたはCまたはA;D=GまたはAまたはT;N=AまたはCまたはGまたはT。
【0061】
「アミノ酸」という用語は、本明細書で用いる場合、アミノ基(−NH)およびカルボキシル基(−COOH)を、好ましくは遊離基としてあるいは縮合後にペプチド結合の一部として含む任意の有機化合物を意味する。「天然でコード化されたポリペプチドを形成する20種のα−アミノ酸」は当技術分野で知られており、アラニン(alaまたはA)、アルギニン(argまたはR)、アスパラギン(asnまたはN)、アスパラギン酸(aspまたはD)、システイン(cysまたはC)、グルタミン酸(gluまたはE)、グルタミン(glnまたはQ)、グリシン(glyまたはG)、ヒスチジン(hisまたはH)、イソロイシン(ileまたはI)、ロイシン(leuまたはL)、リシン(lysまたはK)、メチオニン(metまたはM)、フェニルアラニン(pheまたはF)、プロリン(proまたはP)、セリン(serまたはS)、トレオニン(thrまたはT)、トリプトファン(trpまたはW)、チロシン(tyrまたはY)、およびバリン(valまたはV)を意味する。
【0062】
「増幅」という用語は、ポリヌクレオチドのコピー数が増大することを意味する。
【0063】
「抗体」という用語は、本明細書で用いる場合、完全な状態の免疫グロブリン分子、ならびにFab、Fab’、(Fab’)、FvおよびSCAフラグメントなどの抗原のエピトープに対して結合能を有する免疫グロブリン分子のフラグメントを意味する。これらの抗体フラグメントは、該フラグメントの由来である抗体の抗原(例えばポリペプチド抗原)に選択的に結合するある程度の能力を維持しており、当技術分野で公知の方法を用いて作製できる(例えばHarlowおよびLane, 前掲を参照)。該フラグメントは、さらに下記のように説明される。
【0064】
(1) Fabフラグメントは抗体分子の1価抗原結合フラグメントからなり、パパイン酵素により抗体分子全体を消化し、完全な状態のL鎖と、H鎖の一部分とからなるフラグメントを得ることにより作製し得る。
【0065】
(2) 抗体分子のFab’フラグメントは、抗体分子全体をペプシンで処理した後に還元し、完全な状態のL鎖とH鎖の一部分とからなる分子を得ることにより取得できる。この方法で処理した抗体分子1分子当たり2つのFab’フラグメントが得られる。
【0066】
(3) 抗体の(Fab’)フラグメントは、抗体分子全体をペプシン酵素で処理し、その後還元を行わないことにより取得できる。(Fab’)フラグメントは、2個のジスルフィド結合で互いに拘束された2つのFab’フラグメントからなる二量体である。
【0067】
(4) Fvフラグメントは、2本の鎖として発現されるL鎖の可変領域とH鎖の可変領域を含む遺伝子工学的に操作されたフラグメントと定義される。
【0068】
(5) 1本鎖抗体(「SCA」)は、適当なフレキシブルなポリペプチドリンカーで連結されたL鎖の可変領域とH鎖の可変領域とを含む遺伝子工学的に操作された1本鎖分子である。
【0069】
「キメラ特性」を有する分子は、1) 第1の参照分子に部分的に相同であり、部分的に非相同であり;2) それと同時に第2の参照分子に部分的に相同であり、部分的に非相同であり;3) それと同時にさらに1個以上の追加の参照分子に部分的に相同であり、部分的に非相同である可能性を排除するものではない分子である。ある非限定的な実施形態では、キメラ分子は、部分分子配列の再組合わせを構築することにより調製し得る。ある非限定的な態様では、キメラポリヌクレオチド分子は、複数の分子鋳型を用いてキメラポリヌクレオチドを合成することにより調製することができ、その結果得られたキメラポリヌクレオチドは、複数の鋳型の特性を有している。
【0070】
「同族」という用語は、本明細書で用いる場合、種間で進化的かつ機能的に関連付けられる遺伝子配列を意味する。例えば、限定するものではないが、ヒトゲノムにおいては、ヒトCD4遺伝子はマウス3d4遺伝子に対する同族遺伝子である。なぜなら、これらの2つの遺伝子の配列および構造はそれらがかなり相同性が高いということを示しており、そしてそれらの遺伝子は両方ともMHCクラスII拘束性抗原認識によるT細胞活性化のシグナル伝達において機能するタンパク質をコードしているからである。
【0071】
「比較ウィンドウ」とは、本明細書で用いる場合、少なくとも20個の連続したヌクレオチド位置の概念的なセグメントを意味し、ここで1つのポリヌクレオチド配列は、少なくとも20個の連続したヌクレオチドからなる参照配列と比較され得るものであって、比較ウィンドウに含まれる該ポリヌクレオチド配列の一部は、それらの2つの配列の最適アラインメントでは参照配列(これは付加または欠失を含まない)と比較して付加または欠失(すなわちギャップ)が20パーセント以下であり得る。比較ウィンドウをアラインメントするための配列の最適なアラインメントは、Smithの局所的相同アルゴリズム(SmithおよびWaterman, Adv Appl Math, 1981; SmithおよびWaterman, J Teor Biol, 1981; SmithおよびWaterman, J Mol Biol, 1981; Smithら, J Mol Evol, 1981)、Needlemanの相同アラインメントアルゴリズム(NeedlemanおよびWuncsch, 1970)、Pearsonの類似性サーチ方法(PearsonおよびLipman, 1988)、これらのアルゴリズムのコンピュータインプリメンテーション(GAP、BESTFIT、FASTA、およびTFASTA(Wisconsin Genetics Software Package Release 7.0, Genetics Computer Group, 575 Science Dr., Madison, WI))、または検査によって行うことができ、種々の方法によって作製された中での最適アラインメント(すなわち比較ウィンドウ全体にわたって最大パーセンテージの相同性が得られる)が選択される。
【0072】
本明細書で用いる場合、「相補性決定領域」および「CDR」という用語は、例えば、一般に超可変領域またはハイパー可変ループとしても知られているKabatおよびChothiaらのCDRの定義(ChothiaおよびLesk, 1987; Clothiaら, 1989; Kabatら, 1987;およびTramontanoら, 1990)に例示される当技術分野で認められている用語を意味する。可変領域ドメインは、一般に、天然免疫グロブリン鎖(例えばアミノ酸1〜110)のアミノ末端側の約105〜115アミノ酸を含むが、幾分短いかまたは長い可変ドメインも、1本鎖抗体を形成するのに適している。
【0073】
「保存的アミノ酸置換」とは、類似の側鎖を有する残基による互換性を意味する。例えば、脂肪族側鎖を有するアミノ酸のグループはグリシン、アラニン、バリン、ロイシンおよびイソロイシンであり;脂肪族ヒドロキシル側鎖を有するアミノ酸のグループはセリンおよびトレオニンであり;アミド含有側鎖を有するアミノ酸のグループはアスパラギンおよびグルタミンであり;芳香族側鎖を有するアミノ酸のグループはフェニルアラニン、チロシンおよびトリプトファンであり;塩基性側鎖を有するアミノ酸のグループはリシン、アルギンンおよびヒスチジンであり;硫黄含有側鎖を有するアミノ酸のグループはシステインおよびメチオニンである。好ましい保存的アミノ酸置換グループは、バリン−ロイシン−イソロイシン、フェニルアラニン−チロシン、リシン−アルギニン、アラニン−バリン、およびアスパラギン−グルタミンである。
【0074】
「〜に対応する」という用語は、本明細書で用いる場合、ポリヌクレオチド配列が参照ポリヌクレオチド配列の全部または一部に相同(すなわち同一であるが、厳密には進化的に近縁でない)であるか、あるいはポリペプチド配列が参照ポリペプチド配列と同一であることを意味する。一方、「〜に相補的な」という用語は、本明細書で用いる場合、相補配列が参照ポリヌクレオチド配列の全部または一部に相同であることを意味する。例を挙げると、ヌクレオチド配列「TATAC」は参照配列「TATAC」に対応し、参照配列「GTATA」に相補的である。
【0075】
「分解有効量」という用語は、酵素と接触していない基質と比較して、基質の少なくとも50%を処理するのに必要な酵素の量を意味する。好ましくは、基質の少なくとも80%が分解される。
【0076】
本明細書で用いる場合、「確定配列フレームワーク」という用語は、非ランダムな基準に基づいて、一般には実験データまたは構造データに基づいて選択される確定配列のセットを意味し、例えば、確定配列フレームワークは、β−シート構造を形成すると予測されるアミノ酸配列のセット、または、特に、ロイシンジッパーヘプタッドリピートモチーフ、ジンクフィンガードメインを含み得る。「確定配列の核(kernal)」は、限定された多様性を含む配列のセットである。(1) 20個の通常アミノ酸からなる完全にランダムな10マー配列は、(20)10個の配列のうちのいずれかであり得るものであり、そして(2) 20個の通常アミノ酸からなる擬似ランダムな10マー配列は、(20)10個の配列のうちのいずれかであり得るが、特定の位置および/または全体における特定の残基に対して偏りがあるのに対して、(3) 確定配列の核は、各残基位置が許容できる20個の通常のアミノ酸(および/または許容できる通常とは異なるアミノ/イミノ酸)のいずれかであり得る場合の配列の部分集合である。確定配列の核は、一般に、個々の選択されたライブラリーのメンバー配列の一部または全長にわたって、可変および不変の残基位置、および/またはアミノ酸残基の確定された部分集合から選択される残基を含み得る可変の残基位置などを含む。確定配列の核は、アミノ酸配列またはポリヌクレオチド配列を意味する。例えば、例示するものであって限定するものではないが、配列(NNK)10および(NNM)10(ここで、NはA、T、GまたはCであり、KはGまたはTであり、MはAまたはCである)が確定配列の核である。
【0077】
DNAの「消化」は、DNA中の特定の配列にのみ作用する制限酵素によるDNAの触媒的切断を意味する。本明細書で用いられる種々の制限酵素は市販されており、その反応条件、補因子およびその他の必要条件は、当業者に知られているように使用される。分析目的の場合、一般に、1μgのプラスミドまたはDNA断片が約2単位の酵素とともに約20μlのバッファー溶液中で用いられる。プラスミド構築用のDNA断片を単離する目的の場合、一般に、5〜50μgのDNAが20〜250単位の酵素で大容量にて消化される。特定の制限酵素に適したバッファーおよび基質の量は、製造業者により指定されている。通常、インキュベーション時間は37℃にて約1時間であるが、供給元の取り扱い説明書により様々であり得る。消化後、反応物を直接ゲル上で電気泳動させて所望の断片を単離する。
【0078】
「指向性ライゲーション」とは、ポリヌクレオチドの5’末端と3’末端が、好ましいライゲーションの向きを指定するのに十分なほど相違しているライゲーションを意味する。例えば、2つの平滑末端を有する、特に処理および消化を行っていないPCR産物は、一般に、そのマルチクローニング部位に平滑末端をもたらすように消化されたクローニングベクターにライゲートする場合、好ましいライゲーションの方向性をもたず、よって、一般には指向性ライゲーションはこれらの状況下では呈示されない。これとは対照的に、5’EcoRI−処理末端および3’BamHI処理末端を有する消化されたPCR産物をEcoRIおよびBamHIで消化したマルチクローニング部位を有するクローニングベクターにライゲートする場合、一般に指向性ライゲーションが呈示される。
【0079】
「DNAシャッフリング」という用語は、本明細書で用いる場合、実質的に相同であるが同一でない配列間の組換えを示すものであり、いくつかの実施形態では、DNAシャッフリングは、cer/loxおよび/またはflp/frt系などの非相同的組換えによる乗換えを含み得る。
【0080】
本発明で用いる場合、「エピトープ」という用語は、フィターゼペプチドなどの抗原の抗原決定基を意味し、これにフィターゼ特異的抗体などの抗体のパラトープが結合する。抗原決定基は、通常、アミノ酸または糖側鎖などの分子の化学的に活性な表面配置からなり、特異的な三次元構造特性ならびに特異的な荷電特性を有し得る。本明細書で用いる場合、「エピトープ」とは、抗体の可変領域結合部と相互作用する結合相互作用の形成能を有する抗原またはその他の巨大分子の一部を意味する。一般に、そのような結合相互作用は、CDRの1個以上のアミノ酸残基との分子間接触として現れる。
【0081】
「断片」、「誘導体」および「類似体」という用語は、参照ポリペプチドを意味する場合、参照ポリペプチドと少なくとも本質的に同一の少なくとも1つの生物学的機能または活性を保持するポリペプチドを含む。さらに、「断片」、「誘導体」または「類似体」という用語は、切断によって改変して有意に高い活性を有する成熟酵素を生産し得る低活性プロタンパク質などの「プロ型」分子で例示される。
【0082】
本発明は、鋳型ポリペプチドから、「単一アミノ酸置換の全レンジ」が各アミノ酸位置に呈示される子孫ポリペプチドのセットを取得する方法を提供する。本明細書で用いる場合、「単一アミノ酸置換の全レンジ」とは、本明細書で記載したように、天然でコードされているポリペプチドを形成する20個のα−アミノ酸に関するものである。
【0083】
「遺伝子」という用語は、ポリペプチド鎖の産生に関与するDNAのセグメントを意味し、コード領域の前後の領域(リーダーおよびトレーラー)ならびに個々のコードセグメント(エキソン)間の介在配列(イントロン)を含む。
【0084】
「遺伝子の不安定性」とは、本明細書で用いる場合、反復性の高い配列が一般に反復配列の欠落による配列の単純化を伴う短縮事象のプロセスにより欠落される自然的傾向を意味する。欠失は、1つの反復配列の1つのコピーの欠落および反復配列間の全ての欠落を伴う傾向がある。
【0085】
「非相同」という用語は、1つの1本鎖核酸配列が別の1本鎖核酸配列またはその相補配列にハイブリダイズすることができないことを意味する。したがって、非相同の領域とは、ポリヌクレオチドの領域またはポリヌクレオチドが、その配列内に、別の核酸またはポリヌクレオチドにハイブリダイズすることができない領域を有することを意味する。そのような領域は、例えば、突然変異の領域である。
【0086】
「相同」または「同祖」という用語は、1つの1本鎖核酸配列が相補的な1本鎖核酸配列にハイブリダイズしうることを意味する。ハイブリダイゼーションの程度は、配列間の同一性の量、ならびに後に述べるような温度および塩濃度などのハイブリダイゼーション条件を含む多くの要因に依存し得る。好ましくは、同一性の領域は、約5bpよりも大きく、より好ましくは同一性の領域は10bpよりも大きい。
【0087】
免疫グロブリンのLまたはH鎖可変領域は、CDRとも呼ばれる、3つの超可変領域によって分断された「フレームワーク」領域からなる。フレームワーク領域の範囲およびCDRは正確に確定されており、”Sequences of Proteins of Immunological Interest”(Kabatら, 1987)を参照されたい。種々のLまたはH鎖のフレームワーク領域の配列は、同種において比較的保存されている。本明細書で用いる場合、「ヒトフレームワーク領域」は、天然ヒト免疫グロブリンのフレームワーク領域に実質的に同一(約85以上、通常90〜95以上)のフレームワーク領域である。抗体のフレームワーク領域、すなわち構成成分のL鎖とH鎖を組み合わせたフレームワーク領域は、CDRの位置決めおよびアラインメントに用いられる。CDRは、主に抗原のエピトープへの結合を担う。
【0088】
本発明の利点は「産業上の用途」(または産業上のプロセス)にも及ぶ。この用語は、商業的産業そのもの(または単純な産業)ならびに非商業的な産業上の用途(例えば非営利組織における生物医学的研究)における用途を含むものとして用いられる。関連用途としては、診断、医薬、農業、製造業および学術の分野における用途が挙げられる。
【0089】
「同一の」または「同一性」という用語は、2つの核酸配列が同一配列または相補配列を有することを意味する。したがって、「同一性領域」とは、ポリヌクレオチドのある領域またはポリヌクレオチド全体が別のポリヌクレオチドのある領域または該ポリヌクレオチドと同一または相補的であることを意味する。
【0090】
「単離された」という用語は、その最初の環境(例えば天然物である場合にはその天然の環境)から取り出されていることを意味する。例えば、生きている動物に存在する天然ポリヌクレオチドまたは酵素は単離されていないが、天然系に共存している物質のいくつかまたは全てから分離された同ポリヌクレオチドまたは酵素は単離されている。そのようなポリヌクレオチドはベクターの一部であってもよく、および/またはそのようなポリヌクレオチドもしくは酵素は、組成物(composition)の一部であってもよい。さらに、そのようなベクターまたは組成物がその天然環境の一部ではない場合に単離されるものであってよい。
【0091】
「単離された核酸」とは、その由来の生物の天然ゲノム中に存在する場合には通常直ぐ隣接している5’および3’隣接配列と隣接していない核酸、例えばDNAまたはRNA分子を意味する。したがって、この用語は、例えば、ベクター、例えばプラスミドまたはウイルスベクターなどに組み込まれている核酸;異種細胞のゲノム(または同種細胞のゲノムの場合には天然部位とは異なる部位)に組み込まれている核酸;ならびに分離分子、例えばPCR増幅または制限酵素消化によって産生されたDNA断片またはin vitro転写によって産生されたRNA分子として存在する核酸を記述するものである。またこの用語は、例えば、融合タンパク質の産生に用いることができる別のポリペプチド配列をコードするハイブリッド遺伝子の一部を形成する組換え核酸も記述するものである。
【0092】
本明細書で用いる場合、「リガンド」とは、特定のレセプターによって認識される、ランダムペプチドまたは可変セグメント配列などの分子を意味する。当業者には理解されるように、分子(または巨大分子複合体)はレセプターでもリガンドでもあり得る。一般に、より小さい分子量の結合パートナーはリガンドと呼ばれ、より大きい分子量の結合パートナーはレセプターと呼ばれる。
【0093】
「ライゲーション」とは、2つの2本鎖核酸断片間にホスホジエステル結合を形成させるプロセスを意味する(Sambrookら, 1982, p.146; Sambrook, 1989)。特に示さない限り、ライゲーションは、公知のバッファーを用い、ライゲートされるDNA断片をほぼ等モル量で含む0.5μgに対しT4 DNAリガーゼ(「リガーゼ」)を10単位という条件を用いて行うことができる。
【0094】
本明細書で用いる場合、「リンカー」または「スペーサー」とは、2つの分子、例えばDNA結合タンパク質とランダムペプチドを連結する分子または分子のグループを意味し、2つの分子を好ましい立体配置で、例えばランダムペプチドがDNA結合タンパク質に起因する立体障害が最小になるようにレセプターに結合し得るように配置させるのに役立つ。
【0095】
「進化させるべき分子特性」とは、本明細書で用いる場合、ポリヌクレオチド配列から構成される分子、ポリペプチド配列から構成される分子、一部にポリヌクレオチド配列を含み、一部にポリペプチド配列を含む分子に関するものを含む。特に関連のある(ただし限定するものではない)進化させるべき分子特性の例としては、特定の条件、例えば温度、塩度、圧力、pHならびにグリセロール、DMSO、界面活性剤および/または反応環境下で接触させる任意のその他の分子種の濃度などの条件における酵素活性が挙げられる。進化させるべき分子特性の特に関連のある(ただし限定するものではない)別の例としては、安定性、例えば、貯蔵中に発生し得るような特定の環境に一定時間曝された後に存在する残留する分子特性の量が挙げられる。
【0096】
「突然変異」という用語は、野生型核酸配列の配列内の変化またはペプチドの配列内の変化を意味する。そのような突然変異は、トランジションまたはトランスバージョンなどの点突然変異であり得る。該突然変異は、欠失、挿入または重複であり得る。
【0097】
本明細書で用いる場合、縮重「N,N,G/T」ヌクレオチド配列は32個のトリプレットが考えられることを示す(ここで、「N」はA、C、GまたはTであり得る)。
【0098】
「天然」という用語は、本明細書である対象物に対して用いる場合、その対象物が自然界に見出される事実を意味する。例えば、自然界の起源から単離され得る生物(例えばウイルス)中に存在し、実験室で人間によって意図的に改変されていないポリペプチドまたはポリヌクレオチド配列は天然のものである。一般に、天然という用語は、非病的な(病気に罹患していない)個体に存在する、例えばその種にとって典型的であるような対象物を意味する。
【0099】
本明細書中で用いられる「核酸分子」は、少なくとも1塩基あるいは1塩基対(各々、それが一本鎖であるか二本鎖であるかによる)からなるものである。さらに核酸分子は、ヌクレオチド含有分子のいずれかのグループにもっぱら属するか、またはキメラとして属することもあり得る。そのヌクレオチド含有分子は、限定するものではないが、以下の核酸分子のグループによって例示されるものである:RNA、DNA、ゲノム核酸、非ゲノム核酸、天然核酸および天然に生じたものではない核酸、ならびに合成核酸。このヌクレオチド含有分子は、非限定的な例に過ぎないが、ミトコンドリアなどのオルガネラの関連核酸、リボソームRNA、および天然要素と共に1つ以上の非天然要素をキメラ的に含む核酸分子を含む。
【0100】
さらに、「核酸分子」は、限定するものではないがアミノ酸および糖質により例示される、1つ以上の非ヌクレオチドベースの構成要素を部分的に含み得る。したがって、例であって限定するものではないが、部分的にはヌクレオチドに基づいており部分的にはタンパク質に基づいているリボザイムは、「核酸分子」とみなされる。
【0101】
また、例であって限定するものではないが、検出可能な部分(例えば放射性標識または代わりに非放射性標識など)によって標識された核酸分子は、同様に「核酸分子」とみなされる。
【0102】
「(特定の酵素)をコードする核酸配列」または「(特定の酵素)の配列をコードするDNA」または「(特定の酵素)をコードするヌクレオチド配列」という用語、およびその他の同義の用語は、適切な調節配列の制御下に置かれれば転写され、酵素に翻訳されるDNA配列を言う。「プロモーター配列」は、細胞内でRNAポリメラーゼと結合し、下流(3’方向)のコード配列の転写を開始することができるDNA調節領域である。プロモーターはDNA配列の一部である。この配列領域はその3’末端に開始コドンを有する。プロモーター配列は、バックグラウンドを上回る検出可能なレベルでの転写を開始するために必要な構成要素を有している最小限の数の塩基を含む。しかしながら、RNAポリメラーゼが該配列に結合し、転写が開始コドン(プロモーターの3’末端)で開始された後は、転写は3’方向の下流へ進行する。該プロモーター配列内には、転写開始部位(S1ヌクレアーゼによるマッピングで首尾よく定められた)、およびRNAポリメラーゼの結合を司るタンパク質結合ドメイン(コンセンサス配列)が見出されるであろう。
【0103】
「酵素(タンパク質)をコードする核酸」または「酵素(タンパク質)をコードするDNA」または「酵素(タンパク質)をコードするポリヌクレオチド」という用語、およびその他の同義の用語は、該酵素をコードする配列のみを含むポリヌクレオチドだけでなく、更なるコード配列または非コード配列を含むポリヌクレオチドも包含する。
【0104】
1つの好適な実施形態において、「特定の核酸分子種」は、限定するものではないが、一次配列により例示されるその化学構造によって定められるものである。別の好適な実施形態においては、特定の「核酸分子種」は、該核酸種の機能、または該核酸種から誘導された産物の機能によって定められる。したがって、非限定的な例に過ぎないが、「特定の核酸分子種」はそれに起因する1つ以上の活性または特性(その発現産物に起因する活性または特性も含む)により定められる。
【0105】
「核酸ライブラリー中への実施中の核酸サンプルの集合」の本明細書中での定義は、核酸サンプルをベクターに基づくコレクションに組み込む工程(例えばベクター中へのライゲーションおよび宿主の形質転換などによる)を含む。適切なベクター、宿主、およびその他の試薬、並びにその非限定的な特定の実施例についての説明は後述する。また「核酸ライブラリー中への実施中の核酸サンプルの集合」の本明細書中での定義は、核酸サンプルを非ベクターに基づくコレクションに組み込む工程(例えばアダプターとの連結による)をも含む。好ましくは、該アダプターはPCRプライマーとアニールし、PCRによる増幅を促進することができるものである。
【0106】
したがって、非限定的な実施形態において、「核酸ライブラリー」は、ベクターに基づく1つ以上の核酸分子のコレクションを包含する。異なる好適な実施形態においては、「核酸ライブラリー」は、非ベクターに基づく核酸分子のコレクションを包含する。更に異なる好適な実施形態においては、「核酸ライブラリー」は、部分的にベクターに基づき、部分的に非ベクターに基づく、核酸分子の混成コレクションを包含する。好ましくはライブラリーを構成する分子コレクションは検索可能で、かつ各核酸分子種毎に分離可能である。
【0107】
本発明は、「核酸構築物」あるいは「ヌクレオチド構築物」あるいは「DNA構築物」を提供する。用語「構築物」は、本明細書中では、ベクターまたはベクターの一部などの1つ以上のさらなる分子部分と任意に化学結合させ得る、例えばポリヌクレオチド(例えばフィターゼポリヌクレオチド)などの分子を記述するために用いられる。特定の様態であって、しかし限定することを意味するものではない様態においては、ヌクレオチド構築物は、宿主細胞の形質転換に適したDNA発現構築物により例示される。
【0108】
「オリゴヌクレオチド」(または同義的に「オリゴ」)とは、化学合成されたものであり得る一本鎖ポリデオキシヌクレオチドまたは相補二本鎖ポリデオキシヌクレオチドを言う。そのような合成オリゴヌクレオチドは、5’リン酸基を有するものもあるが、有しないものもある。5’リン酸基を有しないものは、キナーゼ存在下にてATPによりリン酸基を付加しない限り、他のオリゴヌクレオチドと連結することはない。合成オリゴヌクレオチドは脱リン酸化されていない断片と連結される。ポリメラーゼに基づく増幅(例えばPCRによる)を実現するために、「順番に、少なくとも第1の相同配列、縮重N,N,G/T配列、および第2の相同配列、を含んでなる、32倍に縮重したオリゴヌクレオチド」が挙げられる。この文脈で用いられるように、「相同」は、ポリメラーゼに基づいて増幅される親ポリヌクレオチドと前記オリゴとの間の相同性に関する。
【0109】
本明細書中で用いられる用語「機能しうる形で連結された」とは、機能的な関係にあるポリヌクレオチドのエレメントの連結を言う。核酸は、別の核酸配列との機能的関係性のうちに配置される場合、核酸は「機能しうる形で連結され」ている。例えば、プロモーターまたはエンハンサーは、それがコード配列の転写に影響を及ぼすならば、該コード配列に機能しうる形で連結されているのである。機能しうる形で連結された、とは、連結されたDNA配列が典型的に連続的であること、またタンパク質をコードする2つの領域を結合する必要がある場合には連続的かつリーディングフレーム内にあることを意味している。
【0110】
RNAポリメラーゼが1つのmRNA中に前記2つのコード配列を転写し、次いで該mRNAが両方のコード配列に由来するアミノ酸配列を含む1つのポリペプチドに翻訳される場合、コード配列は別のコード配列に「機能しうる形で連結され」ている。発現される配列が最終的に所望のタンパク質を産生するようにプロセシングされるのであれば、該コード配列は互いに連続的である必要はない。
【0111】
本明細書中で用いられる用語「親ポリヌクレオチドセット」は、1つ以上の異なるポリヌクレオチド種を含むセットである。通常この用語は、好ましくは親セットの突然変異誘発によって得られる子孫ポリヌクレオチドセットに関連して用いられ、この場合用語「親」「出発」および「鋳型」を互換的に用いることができる。
【0112】
本明細書中で用いられる用語「生理学的条件」とは、生存生物に適合しており、および/または培養酵母生細胞もしくは培養哺乳動物生細胞において細胞内に典型的に存在する、温度、pH、イオン強度、粘性、および同様の生化学的パラメーターを言う。例えば、典型的な実験室培養条件下で増殖させる酵母細胞における細胞内条件は生理学的条件である。in vitroでの転写カクテルに対する適切なin vitro反応条件は、一般に生理学的条件である。一般に、in vitro生理学的条件は、50〜200mM NaClまたはKCl, pH6.5〜8.5, 20〜45℃, および0.001〜10mMの二価陽イオン(例えばMg2+、Ca2+);好ましくは、約150mM NaClまたはKCl, pH7.2〜7.6、5mM 二価陽イオンを含み、さらにしばしば0.01〜1.0%の非特異的タンパク質(例えばBSA)を含む。非イオン性界面活性剤(Tween、NP−40、Triton X−100)が、通常約0.001〜2%、典型的には0.05〜0.2%(v/v)でしばしば存在する。特定の水性条件は、従来方法に従って当業者により選択され得る。一般的な指針としては、以下の緩衝化水性条件を適用できる:10〜250mM NaCl, 5〜50mM Tris HCl, pH5〜8, さらに任意に二価陽イオンおよび/または金属キレーターおよび/または非イオン性界面活性剤および/または膜画分および/または消泡剤および/またはシンチラントを含む。
【0113】
二本鎖ポリヌクレオチドの配列を記載するために、本明細書中では標準規則(5’から3’へ)を用いている。
【0114】
本明細書中で用いられる用語「群」は、例えばポリヌクレオチド、ポリヌクレオチドの一部分、またはタンパク質などの構成要素のコレクションを意味する。「混合群」とは、同じファミリーの核酸またはタンパク質に属する(すなわち、近縁である)がその配列は異なっており(すなわち、同一ではない)、したがってその生物学的活性も異なっている構成要素のコレクションを意味する。
【0115】
「プロ型」を有する分子とは、参照とする該プロ型分子と比較して性質の違い(例えば活性の増加)を有するより成熟した分子型に至る途上において、共有結合性および非共有結合性の化学修飾(例えばグリコシル化、タンパク質加水分解切断、二量体化またはオリゴマー化、温度誘導性もしくはpH誘導性コンホメーション変化、補因子との結合など)を、1以上の任意の組み合わせで受ける分子を言う。成熟分子の生成の途中で2以上の化学修飾(例えば2回のタンパク質加水分解切断、またはタンパク質加水分解切断と脱グリコシル化)を区別できる場合には、該参照となる前駆体分子は「プレプロ型」分子と称される。
【0116】
本明細書中で用いられる用語「擬似ランダム」は、例えば、擬似ランダム部位以外の別の部位での残基変動性の程度はある程度の残基変動が許容されているものの制限されているような、制限された変動性を有する一連の配列に関して言う。
【0117】
本明細書中で用いられる、「擬反復単位」とは、再組合せされる反復配列を言うが、これは定義上同一ではない。実際、同一の出発配列の突然変異誘発により作製された実質的に同一のコード単位に対してだけでなく、いくつかの領域でかなり相違している類似または近縁配列の再組合せに対しても前記方式が持ち出される。それでも、該配列がこのアプローチにより再組合せされるだけの十分な相同性を有するのであれば、それらの配列は「擬反復した」単位と称され得る。
【0118】
本明細書中で用いられる「ランダムペプチドライブラリー」とは、1セットのランダムペプチドをコードするポリヌクレオチド配列のセット、およびそれらのポリヌクレオチド配列によりコードされるランダムペプチドのセット、並びにそれらのランダムペプチドを含む融合タンパク質のセットを言う。
【0119】
本明細書中で用いられる「ランダムペプチド配列」とは、2つ以上のアミノ酸モノマーを含み、確率論的すなわちランダムな方法により構築されたアミノ酸配列を言う。ランダムペプチドは不変配列を含み得るフレームワークモチーフまたは足場モチーフを含んでもよい。
【0120】
本明細書中で用いられる「レセプター」とは、特定のリガンドに対して親和性を有する分子を言う。レセプターは天然分子または合成分子であり得る。レセプターは不変状態でまたは他種との会合体として用いられ得る。レセプターは結合メンバーと、直接にまたは特異的結合物質を介して、共有結合的にまたは非共有結合的に、結合し得る。レセプターの例としては、限定するものではないが、モノクローナル抗体および特定の抗原決定基(例えばウイルス、細胞、または他の物質上にある)と反応性のある抗血清を含む抗体、ならびに細胞膜受容体、複合糖質および糖タンパク質、酵素、ならびにホルモン受容体が挙げられる。
【0121】
「組換え」酵素とは、組換えDNA技術により産生される酵素、すなわち所望の酵素をコードする外来性DNA構築物により形質転換した細胞から産生される酵素を言う。「合成」酵素は、化学合成により作製されるものである。
【0122】
用語「近縁ポリヌクレオチド」は、ポリヌクレオチドのある領域または範囲が同一であって、該ポリヌクレオチドのある領域または範囲が非相同性であることを意味する。
【0123】
本明細書中で用いられる「減少性再組合せ」は、反復配列により媒介される欠失(および/または挿入)事象を通じて生ずる分子多様性の増大に関して言う。
【0124】
以下の用語は、2種類以上のポリヌクレオチド間の配列の関連性を述べるために用いられる:「参照配列」「比較ウィンドウ」「配列同一性」「配列同一性のパーセンテージ」および「実質的同一性」。
【0125】
「参照配列」は、配列比較の基準として用いられる確定配列である。参照配列は、例えば配列リストに挙げた完全長cDNAまたは遺伝子配列のセグメントのようにより大きな配列の部分配列であってもよく、または完全なcDNAまたは遺伝子配列を含んでもよい。一般的には、参照配列は、少なくとも20ヌクレオチド長、しばしば少なくとも25ヌクレオチド長、および多くの場合少なくとも50ヌクレオチド長である。2種類のポリヌクレオチドは、それぞれが(1)該2種類のポリヌクレオチド間で類似した配列(すなわち完全なポリヌクレオチド配列の一部)を含み、また(2)該2種類のポリヌクレオチド間で相違している配列をさらに含むことから、該2種類(またはそれ以上)のポリヌクレオチド間の配列比較は、典型的には「比較ウィンドウ」にわたって該2種類のポリヌクレオチドの配列を比較し配列の類似した局所領域を同定し比較することによって、行うことができる。
【0126】
本明細書中で用いられる「反復指数(RI)」は、クローニングベクター中に含められる擬反復単位の平均コピー数である。
【0127】
用語「制限部位」とは、制限酵素が作用を現すのに必要であって、触媒的切断部位を含んでいる認識配列を言う。切断部位は、多義性の低い配列(すなわち、制限部位の出現頻度の主たる決定要因を含む配列)を含む制限部位の一部分に含まれても含まれていなくてもよいことは、理解されている。したがって多くの場合、適切な制限部位は、内部切断部位(例えばEcoRI部位では、G/AATTC)または直ぐ隣接した切断部位(例えばEcoRII部位では、/CCWGG)を有する、低多義性配列のみを含むものである。その他の場合で、適切な制限酵素[例えばEco57I部位すなわちCTGAAG(16/14)]は、低多義性配列(例えばEco57I部位ではCTGAAG配列)と外部切断部位(例えばEco57I部位のN16部分にある)を含む。酵素(例えば制限酵素)がポリヌクレオチドを「切断」すると言う場合、該制限酵素がポリヌクレオチドの切断を触媒または促進することを意味するということは、理解されよう。
【0128】
非限定的な1つの様態において、「選択可能なポリヌクレオチド」は、5’末端領域(すなわち端の領域)、中間領域(すなわち内部または中央の領域)、および3’末端領域(すなわち端の領域)からなる。この様態において用いる場合、5’末端領域は5’ポリヌクレオチド末端方向に位置する領域であり、したがってポリヌクレオチドの5’側半分の中に部分的にまたは全体として含まれる。同様に、3’末端領域は3’ポリヌクレオチド末端方向に位置する領域であり、したがってポリヌクレオチドの3’側半分の中に部分的にまたは全体として含まれる。本明細書の非限定的な実施例に示されるように、任意の2つの領域間または3つの領域全ての間でさえ、重複した配列が存在し得る。
【0129】
用語「配列同一性」は、2種類のポリヌクレオチド配列が比較のウィンドウ全体にわたって同一である(すなわち、ヌクレオチド1つ毎に基づいて)ことを意味している。用語「配列同一性のパーセンテージ」は、比較ウィンドウ全体にわたって最適にアラインした2つの配列を比較し、両方の配列中で同一な核酸塩基(例えば、A、T、C、G、UまたはI)の位置数を決定してマッチ位置数を出し、該マッチ位置数を比較ウィンドウ内の全位置数(すなわちウィンドウサイズ)で除算し、その結果を100倍して配列同一性のパーセンテージを出すことにより、算出されるものである。本明細書中で用いられるこの「実質的同一性」は、ポリヌクレオチド配列の1つの特性を示すものであり、ここで該ポリヌクレオチドは、少なくとも25〜50ヌクレオチドである比較ウィンドウの参照配列と比較して、少なくとも80%の配列同一性、好ましくは少なくとも85%の同一性、多くの場合90〜95%の配列同一性、および最も一般的には少なくとも99%の配列同一性を有する配列を含み、またその配列同一性のパーセンテージは、欠失または付加を比較ウィンドウ全体にわたって参照配列の全部で20%以下で含み得るポリヌクレオチドと参照配列を比較することにより算出される。
【0130】
当業界で公知の通り、2種類の酵素間の「類似性」は、一方の酵素のアミノ酸配列およびその保存されたアミノ酸置換を、もう一方の酵素の配列と比較することにより、決定される。類似性は当業界で周知の手法、例えばBLASTプログラム(Basic Local Alignment Search Tool at the National Center for Biological Information)により決定することができる。
【0131】
本明細書中で用いられる用語「一本鎖抗体」とは、通常はスペーサーペプチド(例えば[Gly−Gly−Gly−Gly−Ser])を介することが好まれるポリペプチド結合においてVドメインとVドメインを含んでなるポリペプチドを言い、これはアミノ末端および/またはカルボキシル末端にさらなるアミノ酸配列を含んでもよい。例えば一本鎖抗体は、コード化ポリヌクレオチドに連結するためのつなぎ鎖(tether)セグメントを含み得る。例えば、scFvが一本鎖抗体である。一般に一本鎖抗体は、免疫グロブリンスーパーファミリーの遺伝子(例えば、WilliamsおよびBarclay, 1989, pp.361−368を参照のこと。これは参照により本明細書中に組み込まれる。)によって本質的にコードされている、最も多くの場合、げっ歯類、非ヒト霊長類、鳥類、ブタ、ウシ、ヒツジ、ヤギ、またはヒトの重鎖または軽鎖の遺伝子配列によってコードされている少なくとも10個の連続したアミノ酸のポリペプチドセグメント1つ以上からなるタンパク質である。機能的な一本鎖抗体は、一般的に、特定の標的分子、典型的にはレセプターまたは抗原(エピトープ)に対する結合特性を維持するのに十分な、免疫グロブリンスーパーファミリー遺伝子産物の一部分を含む。
【0132】
一対の分子(例えば抗体−抗原ペア、または核酸ペア)のメンバーは、それらが他の非特異的な分子より高い親和性で互いに結合する場合、互いに「特異的に結合する」と言われる。例えば、ある抗原(非特異的タンパク質に対するよりもより効率的に抗体が結合する)に対して産生された抗体は、該抗原と特異的に結合するというように記述され得る。(同様に核酸プローブは、それが塩基対形成相互作用により核酸標的と特異的な二重鎖を形成する場合、該核酸標的と特異的に結合するというように記述され得る(上記を参照のこと)。)
「特異的ハイブリダイゼーション」は、本明細書中では、第1のポリヌクレオチドと第2のポリヌクレオチド(例えば、第1のポリヌクレオチドとは異なっているが本質的に同一の配列を有するポリヌクレオチド)の間でのハイブリッド形成として定義され、本質的に非近縁なポリヌクレオチド配列は混合物中でハイブリッドを形成しない。
【0133】
用語「特定のポリヌクレオチド」は、特定の末端を有し、また特定の核酸配列を有するポリヌクレオチドを意味する。一方のポリヌクレオチドが他方のポリヌクレオチドの一部と同一の配列を有するが末端は異なっている場合の、それら2つのポリヌクレオチドは2つの異なる特定のポリヌクレオチドを含むものである。
【0134】
「ストリンジェントなハイブリダイゼーション条件」は、その配列の間に少なくとも90%の同一性、好ましくは少なくとも95%の同一性、および最も好ましくは少なくとも97%の同一性が存在する場合のみ、ハイブリダイゼーションが起こるであろう場合を意味する。Sambrookら, 1989を参照のこと。それはその全体が参照により本明細書に組み入れられる。
【0135】
また、配列番号1の配列などの、フィターゼポリペプチドの配列と「実質的に同一」である配列を有するポリペプチドも、本発明に包含される。「実質的に同一」なアミノ酸配列は、保存的アミノ酸置換のみによって参照配列と異なっている配列である。この保存的アミノ酸置換とは、例えばアミノ酸1個を同じクラスの別のものに置換することである(例えば、イソロイシン、バリン、ロイシン、またはメチオニンなどの1個の疎水性アミノ酸をその別のアミノ酸に置換すること、またはアルギニンをリジンに置換、グルタミン酸をアスパラギン酸に置換、あるいはグルタミンをアスパラギンに置換というように、1個の極性アミノ酸を別の極性アミノ酸に置換すること)。
【0136】
さらに、「実質的に同一」なアミノ酸配列は、参照配列と1つ以上の非保存的置換、欠失、または挿入により相違している配列であって、特にそのような置換がその分子の活性部位ではない部位で起き、かつそのポリペプチドがその特性を本質的に保持している場合である。例えば、1個以上のアミノ酸がフィターゼポリペプチドから欠失し、その結果該ポリペプチドの構造が改変されるが、その生物学的活性に有意な変化がない場合であり得る。例えば、フィターゼの生物学的活性に必要でないアミノ末端またはカルボキシル末端のアミノ酸は除去することができる。そのような改変によって、より小さな活性フィターゼポリペプチドを開発することができる。
【0137】
本発明は、「実質的に純粋な酵素」を提供する。用語「実質的に純粋な酵素」は、本明細書中で、他のタンパク質、脂質、炭化水素、核酸、および天然には共に存在しているその他の生体物質を実質的に含まないポリペプチド(例えば、フィターゼポリペプチドまたはその断片)などの分子を記述するために用いられる。例えば、実質的に純粋な分子(例えばポリペプチド)は、目的の分子を乾燥重量で少なくとも60%含み得る。該ポリペプチドの純度は、例えばポリアクリルアミドゲル電気泳動(例えばSDS−PAGE)、カラムクロマトグラフィー(例えば高速液体クロマトグラフィー(HPLC))、およびアミノ末端アミノ酸配列分析を含む、標準法を用いて測定できる。
【0138】
本明細書中で用いられる「実質的に純粋」は、目的種が支配種として存在しており(すなわちモル基準で、目的種がその組成物中に他の各々の巨大分子種よりも大量に存在する)、さらに好ましくは実質的に精製した画分は、目的種が存在している巨大分子種全ての少なくとも約50%(モル基準で)からなるような組成物であることを意味する。一般に、実質的に純粋な組成物は、組成物中に存在する巨大分子種全ての約80〜90%以上からなる。最も好ましくは、目的種は、本質的に均一(混入種が従来の検出法では該組成物中に検出できない)になるまで精製され、該組成物は本質的に単一の巨大分子種からなる。溶媒種、小分子(500ダルトン未満)および元素イオン種は、巨大分子種とみなされない。
【0139】
本明細書中で用いられる「可変セグメント」は、ランダム、擬似ランダム、または確定された核配列を含む初期ペプチドの一部を言う。「可変セグメント」は、ランダム、擬似ランダム、または確定された核配列を含む初期ペプチドの一部を言う。「可変セグメント」は、可変残基位置と不変残基位置を両方含み得るが、可変残基位置における残基変動性の程度は制限される。当業者の裁量で、両方の選択肢が選択される。典型的には、可変セグメントは約5〜20アミノ酸残基長(例えば8〜10)であるが、可変セグメントはより長くてもよく、また、抗体断片、核酸結合タンパク質、レセプタータンパク質などの抗体部分またはレセプタータンパク質を含んでもよい。
【0140】
用語「野生型」は、そのポリヌクレオチドが突然変異を全く含まないことを意味する。「野生型」タンパク質は、該タンパク質が天然にみられる活性レベルで活性を有し、また天然にみられるアミノ酸配列を含むことを意味する。
【0141】
例えば「実施中のサンプル」中の用語「実施中の」は、単に、それが実施中であるサンプルのことである。同様に、例えば「実施中の分子」は、それが実施中である分子のことである。
【0142】
発明の詳細な説明
本明細書に記載の発明は、高度に複雑な直線配列(DNA、RNAまたはタンパク質等)の組換えを介した定方向分子進化を可能とする、減少性再組合せ、組換えおよび選択という反復サイクルの使用に向けられる。
【0143】
in vivoでの分子のシャッフリングは、細胞の、多量体を組み換えるという天然の性質を利用して成し遂げられる。in vivoでの組換えは分子の多様性への主要な天然の経路を提供してきたが、他方、遺伝子の組換えは、1)相同性の認識、2)鎖の開裂、鎖の侵入および組換えキアズマの発生を導く代謝ステップならびに最後に、3)別々の組換え分子へのキアズマの分離を含む相対的に複雑な工程のままである。染色体交差の形成には相同配列の認識が必要とされている。
【0144】
好ましい実施形態では、本発明は少なくとも第1ポリヌクレオチドおよび第2ポリヌクレオチドからハイブリッドポリヌクレオチドを作製する方法に関する。本発明を使用して、少なくとも1つの部分的な相同配列領域を共有する少なくとも第1ポリヌクレオチドおよび第2ポリヌクレオチドを好適な宿主細胞に導入することによりハイブリッドポリヌクレオチドを作製できる。部分的な相同配列領域はハイブリッドポリヌクレオチドを作製する配列再編成に帰するプロセスを助長する。本明細書において、「ハイブリッドポリヌクレオチド」とは本発明の方法に起因し、かつ少なくとも2つのオリジナルのポリヌクレオチド配列に由来する配列を含むヌクレオチド配列のいずれでもある。かかるハイブリッドポリヌクレオチドはDNA分子間の配列統合を促進する分子間組換えという事象に起因し得る。さらに、かかるハイブリッドポリヌクレオチドはDNA分子内のヌクレオチド配列を変化させるために反復配列を利用する分子内減少性再組合せプロセスにも起因し得る。
【0145】
本発明は、生物学的に活性なハイブリッドポリペプチドをコードし得るハイブリッドポリヌクレオチドを作製する手段を提供する。ある態様では、オリジナルのポリヌクレオチドは生物学的に活性なポリペプチドをコードする。本発明の方法は細胞プロセスを利用することによって新規のハイブリッドポリペプチドを製造する。これはオリジナルのポリヌクレオチド配列を統合し、その結果得られるハイブリッドポリヌクレオチドがオリジナルの生物学的に活性なポリペプチドに由来する活性を示すポリペプチドをコードするものである。例えば、オリジナルのポリヌクレオチドは異なる微生物に由来する特定の酵素をコードし得る。例えば、ある生物に由来する第1ポリヌクレオチドにコードされる酵素は、特定の環境条件下、例えば高塩分濃度で効果的に機能するものであってもよい。異なる生物に由来する第2ポリヌクレオチドにコードされる酵素は極端な高温などの異なる環境条件下で効果的に機能するものであってもよい。オリジナルの第1および第2ポリヌクレオチドに由来する配列を含むハイブリッドポリヌクレオチドはオリジナルのポリヌクレオチドにコードされる酵素双方の特性を示す酵素をコードし得る。従ってハイブリッドポリヌクレオチドにコードされる酵素は第1および第2ポリヌクレオチドにコードされる各々の酵素により共有される環境条件下、例えば高塩分濃度かつ高温で効果的に機能し得る。
【0146】
本発明のオリジナルのポリヌクレオチドにコードされる酵素としては、限定されるものではないが、酸化還元酵素、トランスフェラーゼ、加水分解酵素、リアーゼ、イソメラーゼおよびリガーゼが挙げられる。本発明の方法により得られるハイブリッドポリペプチドはオリジナルの酵素では示されない特殊化した酵素活性を示し得る。例えば、加水分解酵素活性をコードするポリヌクレオチドの組換えおよび/または減少性再組合せに続いて、各々のオリジナルの酵素から得た特殊化した加水分解酵素活性、すなわち加水分解酵素が作用する結合の種類および加水分解酵素が機能する温度に関して、ハイブリッドポリヌクレオチドによりコードされる得られるハイブリッドポリペプチドをスクリーニングできる。従って、例えば、加水分解酵素は、オリジナルの加水分解酵素からハイブリッド加水分解酵素を区別するそれらの化学的機能性、例えば(a)アミド(ペプチド結合)すなわちプロテアーゼ、(b)エステル結合すなわちエステラーゼおよびリパーゼ、(c)アセタールすなわちグリコシダーゼ、ならびに例えばハイブリッドポリペプチドが機能する温度、pHまたは塩濃度などを確認して、加水分解酵素をスクリーニングし得る。
【0147】
オリジナルのポリヌクレオチドの供給源は個々の生物(「単離体」)、所定の培地で増殖させた生物の集合(「富化培養物」)または最も好ましくは、培養されていない生物(「環境サンプル」)から単離し得る。培養をしないアプローチを使用して環境サンプルから新規の生物活性をコードするポリヌクレオチドを得ることが最も好ましいが、これは、そうすることで未開発の生物多様性資源を利用できることになるからである。
【0148】
「環境ライブラリー」は環境サンプルから作製され、これは好適な原核生物の宿主中で増殖し得るクローニングベクターに保持される天然の生物の集合的ゲノム(collective genome)を意味する。クローン化DNAは最初環境サンプルから直接抽出されるので、ライブラリーが純粋培地で増殖し得る原核生物の小画分に制限されることはない。さらに、これらのサンプルに存在する環境DNAを標準化することにより、オリジナルのサンプルに存在するすべての種に由来するDNAをより平等に提示することができるであろう。これにより、優性種と比較して数倍低く提示されるサンプルの微量構成要素に由来する、興味深い遺伝子を発見する効率を大いに高めることができる。
【0149】
例えば、1種以上の培養されていない微生物から作製した遺伝子ライブラリーを目的の活性に関してスクリーニングする。まず、原核細胞において、目的の生物活性分子をコードする可能性ある経路を遺伝子発現ライブラリーの形で捕らえる。かかるライブラリーから目的の活性をコードするポリヌクレオチドを単離し宿主細胞に導入する。この宿主細胞を、新規なまたは増強された活性を有する可能性のある有効な生体分子を作製する組換えおよび/または減少性再組合せを促進する条件下で増殖させる。
【0150】
ポリヌクレオチドを調製する元となる微生物としては、真正細菌および古細菌などの原核微生物ならびに真菌類などの下等真核微生物、いくつかの藻類および原生動物が挙げられる。ポリヌクレオチドは、核酸が生物を培養せずに回収できる場合、または1種以上の培養生物から回収できる場合に環境サンプルから単離できる。ある態様では、かかる微生物は超好熱菌、好冷菌、耐冷菌、好塩菌、好圧菌および好酸菌などの極限微生物であり得る。極限環境を好む微生物から単離された酵素をコードするポリヌクレオチドが特に好ましい。かかる酵素は陸上の温泉および深海の熱水口において100℃以上の温度で、北極の水における0℃以下の温度で、深海の飽和塩環境で、石炭堆積物および富硫黄地熱泉における約0のpH値で、または下水汚泥における11以上のpH値で機能し得る。例えば、極限環境を好む生物からクローン化され発現されるいくつかのエステラーゼおよびリパーゼは広範囲の温度およびpHを通して高い活性を示す。
【0151】
前記のように選択し単離したポリヌクレオチドを好適な宿主細胞に導入する。好適な宿主細胞は組換えおよび/または減少性再組合せを促進し得る細胞の任意のものである。選択されたポリヌクレオチドは適当な制御配列を含むベクター中にすでにあることが好ましい。宿主細胞は哺乳動物細胞などの高等真核細胞、酵母細胞などの下等真核細胞であってもよく、または好ましくは宿主細胞は細菌細胞などの原核細胞であってもよい。宿主細胞への構築物の導入はリン酸カルシウムトランスフェクション、DEAE−デキストラン媒介性トランスフェクションまたはエレクトロポレーション(Davisら, 1986)により達成される。
【0152】
適当な宿主の典型的な例として、大腸菌、放線菌、ネズミチフス菌などの細菌細胞、酵母などの真菌細胞、キイロショウジョウバエS2およびスポドプテラ(Spodoptera) Sf9などの昆虫細胞、CHO、COSまたはBowes黒色腫などの動物細胞、アデノウイルスおよび植物細胞が挙げられる。適当な宿主の選択は、本明細書の教示に基づいた当業者には自明な技術範囲内にあると考えられる。
【0153】
特に、組換えタンパク質を発現するのに用いられる種々の哺乳動物細胞培養系に関しては、哺乳動物発現系の例として、「SV−40−transformed simian cells support the replication of early SV40 mutants」(Gluzman, 1981)に記載されるサル腎臓繊維芽細胞のCOS−7系および適合ベクターを発現できる他の細胞系、例えばC127、3T3、CHO、HeLaおよびBHK細胞系が挙げられる。哺乳動物発現ベクターは複製起点、好適なプロモーターおよびエンハンサー、そしてまた、あらゆる必要なリボソーム結合部位、ポリアデニル化部位、スプライシング供与および受容部位、転写終結配列および5’フランキング非転写配列を含んでなる。SV40スプライシング部位およびポリアデニル化部位に由来するDNA配列を使用して所望の非転写遺伝子エレメントを得ることができる。
【0154】
目的のポリヌクレオチドを含む宿主細胞は、プロモーターの活性化のために、形質転換体の選択のために、または遺伝子の増幅のために適当なように改変した従来の栄養培地で培養できる。温度、pH等などの培養条件は、発現のために選択された宿主細胞に関してこれまでに使用されたものであり、これは当業者には明らかであろう。次いで、特定の酵素活性を有すると同定されるクローンを配列決定して、増強された活性を有する酵素をコードするポリヌクレオチド配列を同定する。
【0155】
もう1つの態様では、本発明の方法を使用して1個以上のオペロンまたは遺伝子クラスターもしくはその部分に由来する生化学経路をコードする新規ポリヌクレオチドを作製できると考えられる。例えば、細菌および多くの真核生物は、遺伝子(その産物が関連プロセスに関与するもの)を制御するための協調機構を有する。遺伝子は単一の染色体上の「遺伝子クラスター」と呼ばれる構造中に集中しており、クラスター全体の転写を開始する単一のプロモーターを含む、単一の調節配列の制御下でともに転写される。このように、遺伝子クラスターとは、通常その機能により同一であるかまたは関連する、隣接する遺伝子の集団である。遺伝子クラスターによりコードされる生化学経路の例としてはポリケチドがある。ポリケチドは、抗生物質(テトラサイクリンおよびエリスロマイシンなど)、抗癌剤(ダウノマイシン)、免疫抑制剤(FK506およびラパマイシン)および獣医用製剤(モネンシン)を含む生物活性物質の非常に豊富な供給源である分子である。多数のポリケチド(ポリケチドシンターゼにより産生される)は治療薬として価値がある。ポリケチドシンターゼは多機能酵素であり、長さならびに機能性パターンおよび環化パターンの異なる非常に多くの種類の炭素鎖の生合成を触媒する。ポリケチドシンターゼ遺伝子は遺伝子クラスター内にあり、ポリケチドシンターゼの少なくとも1つの種(タイプIと称される)は大きなサイズの遺伝子および酵素を有しており、これが遺伝子操作およびin vitroでのこれらの遺伝子/タンパク質の研究を複雑にしている。
【0156】
研究用の新規ポリケチドを作製するために、ポリケチドまたはその断片、およびポストポリケチド生合成遺伝子のライブラリーから所望の構成要素を選択し、組み合わせることができるのは魅力的である。本発明の方法は分子間組換えを介した新規ポリケチドシンターゼの生成を促進可能とする。
【0157】
好ましくは、遺伝子クラスターDNAを異なる生物から単離し、ベクター、特に、連結された遺伝子クラスターから検出可能なタンパク質またはタンパク質関連アレイ活性の産生を制御および調節し得る発現調節配列を含むベクターに連結する。かかる遺伝子クラスターとともに使用するには、外来DNA導入に関して非常に大きな能力を有するベクターの使用が特に適当であり、例として、大腸菌のf−因子(すなわち稔性因子)が含まれることを本明細書に記載する。この大腸菌のf−因子は接合の際にそれ自身の高頻度導入に影響を及ぼすプラスミドであり、混合された微生物サンプルに由来する遺伝子クラスターなどの大きなDNA断片を獲得し安定に増殖させるための理想のものである。一旦、適当なベクターに連結されれば、異なるポリケチドシンターゼ遺伝子クラスターを含む2個以上のベクターを好適な宿主細胞に導入できる。遺伝子クラスターに共有される部分的な相同配列領域はハイブリッド遺伝子クラスターをもたらす配列再編成という結果となるプロセスを促進する。さらに、オリジナルの遺伝子クラスターには見られない増強された活性に関して新規ハイブリッド遺伝子クラスターをスクリーニングできる。
【0158】
従って、好ましい実施形態では、本発明は、生物学的に活性なハイブリッドポリペプチドを作製し、かかるポリペプチドを増加された活性に関してスクリーニングする方法であって、
1)少なくとも、機能しうる形で連結された第1のポリヌクレオチドおよび機能しうる形で連結された第2ポリヌクレオチド(かかる第1ポリヌクレオチドおよび第2ポリヌクレオチドは少なくとも1個の部分的な相同配列領域を共有している)を適切な宿主細胞に導入し、
2)機能しうる形で連結されるハイブリッドポリヌクレオチドをもたらす配列再編成を促進する条件下で宿主細胞を増殖させ、
3)ハイブリッドポリヌクレオチドによりコードされるハイブリッドポリペプチドを発現させ、
4)増強された生物学的活性の同定を促進する条件下でハイブリッドポリペプチドをスクリーニングし、さらに
5)ハイブリッドポリペプチドをコードするポリヌクレオチドを単離することによる方法に関する。
【0159】
種々の酵素活性をスクリーニングする方法は当業者に公知であり、本明細書中で論ぜられている。本発明のポリペプチドおよびポリヌクレオチドを単離する場合にはかかる方法を使用し得る。
【0160】
使用できる発現ベクターの典型的な例としては、ウイルス粒子、バキュロウイルス、ファージ、プラスミド、ファージミド、コスミド、ホスミド、細菌人工染色体、ウイルスDNA(例えばワクシニア、アデノウイルス、ファウルポックスウイルス、偽狂犬病ウイルスおよびSV40の誘導体)、P1を基にした人工染色体、酵母プラスミド、酵母人工染色体、および目的の特定の宿主(桿菌、コウジカビ属菌および酵母など)に特異的なその他のベクターのいずれをも記載できる。従って、例えば、DNAは、ポリペプチド発現のための種々の発現ベクターの任意のものに含まれ得る。かかるベクターとしては染色体、非染色体および合成DNA配列が挙げられる。多数の好適なベクターが当業者に公知であり、また市販されている。以下のベクターを例として示す:細菌性のもの;pQEベクター(Qiagen)、pBluescriptプラスミド、pNHベクター、λ−ZAPベクター(Stratagene)、ptrc99a、pKK223−3、pDR540、pRIT2T(Pharmacia)、真核生物性のもの;pXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。しかしながら、他のプラスミドまたは他のベクターの任意のものを、それらが宿主中で複製可能であり、かつ生存可能である限りは使用できる。コピー数の少ないベクターまたはコピー数の多いベクターを本発明に関して使用することができる。
【0161】
本発明に使用するのに好ましい種類のベクターはf−因子複製起点を含む。大腸菌のf−因子(すなわち稔性因子)は接合の際にそれ自身の高頻度導入に影響を及ぼすプラスミドであり、細菌染色体自体は低い頻度でしか導入しない。特に好ましい実施形態では、「ホスミド」と呼ばれるクローニングベクターまたは細菌人工染色体(BAC)ベクターを使用する。これらは大腸菌f−因子に由来し、ゲノムDNAの大きなセグメントを安定に組み込むことができる。混合し培養されていない環境サンプルに由来するDNAとともに組み込まれる場合には、これにより大きなゲノム断片を安定な「環境DNAライブラリー」の形にすることができる。
【0162】
本発明において使用するのに好ましいもう1つの種類のベクターはコスミドベクターである。コスミドベクターは本来、ゲノムDNAの大きなセグメントをクローン化し増殖させるために設計された。コスミドベクターへのクローニングは「Molecular Cloning:A laboratory Manual」(Sambrookら, 1989)に詳細に記載されている。
【0163】
発現ベクター中のDNA配列はRNA合成を指令する適当な発現制御配列(プロモーター)に機能しうる形で連結されている。特に有名な細菌性プロモーターとしてlacI、lacZ、T3、T7、gpt、λP、Pおよびtrpが挙げられる。真核生物のプロモーターとしてはCMV極初期、HSVチミジンキナーゼ、初期および後期SV40、レトロウイルス由来のLTRおよびマウスメタロチオネイン−Iが挙げられる。適当なベクターおよびプロモーターの選択は十分に当業者の水準の範囲内にある。発現ベクターはまた翻訳開始のためのリボソーム結合部位および転写ターミネーターを含む。ベクターはまた、発現を増幅させるのに適当な配列も含み得る。プロモーター領域は、CAT(クロラムフェニコールトランスフェラーゼ)ベクターまたは選択マーカーを有する他のベクターを用いて所望の遺伝子のいずれからも選択できる。
【0164】
さらに、発現ベクターは好ましくは、真核細胞培養に関してはジヒドロ葉酸還元酵素またはネオマイシン耐性などの、または大腸菌においてはテトラサイクリンもしくはアンピシリン耐性などの、形質転換された宿主細胞を選択するための表現型特性を提供する1個以上の選択マーカー遺伝子を含む。
【0165】
一般に、組換え発現ベクターは宿主細胞の形質転換を可能にする複製起点および選択マーカー、例えば大腸菌のアンピシリン耐性遺伝子およびS.セレビシエTRP1遺伝子、ならびに下流の構造配列の転写を指令する高率発現遺伝子に由来するプロモーターを含む。かかるプロモーターは特に3−ホスホグリセリン酸キナーゼ(PGK)、α−因子、酸ホスファターゼなどの解糖酵素または熱ショックタンパク質をコードするオペロンから誘導できる。異種構造配列は適当な相において翻訳開始および終結配列、ならびに好ましくは翻訳されたタンパク質の細胞周辺腔または細胞外の培地への分泌を指令できるリーダー配列と結合される。
【0166】
クローニング戦略によっては導入されたベクターと内因性プロモーターの双方を介する発現を可能にすることができ、ベクターによる促進は、その内因性プロモーターが大腸菌において機能しない遺伝子の発現に関して重要なものとなり得る。
【0167】
微生物から単離されたまたは誘導されたDNAは、選択されたDNAを探る前にベクターまたはプラスミドに挿入されることが好ましい。かかるベクターまたはプラスミドは、プロモーター、エンハンサー等をはじめとする発現調節配列を含むものであることが好ましい。かかるポリヌクレオチドはベクターおよび/または構成物の一部であってもよく、また単離されたままのものであってもよい。なぜなら、かかるベクターまたは構成物はその天然環境の一部ではないからである。特に好ましいファージまたはプラスミド、およびそれらに導入し、パッケージングする方法は、本明細書に示されるプロトコールに詳細に説明されている。
【0168】
クローニングベクターの選択は採用されるアプローチに依存し、例えば、宿主細胞にうまく形質転換され、選択され得る多様に反復する配列のコピーまたは多重配列に関しては、ベクターは十分な能力を有するいずれのクローニングベクターでもよい。かかるベクターの1つの例が「Polycos vectors:a system for packaging filamentous phage and phagemid vectors using lambda phage packaging extracts」(Alting−MecsおよびShort,1993)に記載されている。増殖/維持は抗生物質耐性によってクローニングベクターにより行われる。増殖期間の後、自然に短縮された分子を回収し、ゲルまたはカラムでのサイズ分画によって同定するか、または直接増幅する。利用されるクローニングベクターは長い構築物の挿入によって分断されている選択可能な遺伝子を含む場合もある。減少性再組合せが進行するにつれて、反復単位数が減少し、割り込まれた遺伝子が再び発現され、従って処理された構築物に関する選択を行うことができる。所望の生物学的特性を有する発現産物の選択を可能にするベクターは、発現/選択ベクターであってもよい。インサートは機能的プロモーターの下流に位置してもよく、適当な手段によって所望の特性をスクリーニングする。
【0169】
in vivo再編成は、ひとまとめにして「組換え」と呼ばれる「分子間」プロセスに集中され、これは細菌では一般に「RecA−依存性」現象として観察される。本発明は、宿主細胞の配列を組換え、再組合せさせる組換えプロセス、または減少プロセスを媒介して欠失により細胞中の擬反復配列の複雑性を減少させる細胞の能力に依存する。「減少性再組合せ」というこのプロセスは「分子間」RecA依存性プロセスにより起こる。
【0170】
従って、本発明の別の態様では、減少性再組合せのプロセスによって新規ポリヌクレオチドを作製できる。この方法は連続配列(元のコード配列)を含む構築物の作製、それらの適当なベクターへの挿入およびそれに続く適当な宿主細胞への導入を含む。個々の分子の同一性の再組合せは相同領域を有する構築物中の連続配列間または擬反復単位間の組合せプロセスにより起こる。再編成プロセスにより組換え、ならびに/または複雑性および反復配列の程度が減少し、結果として新規分子種の産生をもたらす。種々の処理を適用して再編成率を高めることができる。これらには紫外線光またはDNAに損傷を与える化学物質を用いる処理および/または増強されたレベルの「遺伝的不安定性」を示す宿主細胞系の使用が含まれうる。従って、再組合せプロセスは、それら自身の進化を指令する相同組換え、または擬反復配列という天然の特性を含み得る。
【0171】
反復配列または「擬反復」配列は遺伝子の不安定性において役割を果たす。本発明では、「擬反復」とはそれらの元の単位構造を制限しない反復である。擬反復単位は構築物中の配列のアレイ、すなわち同様の配列の連続単位として提供される。ひと度連結されれば、連続配列間の接合点は本質的にはそれとわからないものになり、分子レベルではもはや得られる構築物の擬反復特性が連続するものとなる。得られる構築物の複雑性を減少させるよう細胞が行う欠失プロセスは擬反復配列間に作用する。擬反復単位により事実上制限のない鋳型レパートリーが提供され、そこでずれという事象が起こり得る。従って、擬反復を含む構築物は、欠失(および可能性としては挿入)事象が擬反復単位内の実質的にどこでも起こり得るという十分な分子適応性を効果的に示す。
【0172】
擬反復配列がすべて同じ向きに、例えば頭対尾、またはその逆に連結される場合には、細胞は個々の単位を区別できない。従って、縮小プロセスが配列中で起こり得る。対照的に、例えば、単位が頭対尾ではなく頭対頭を示す場合には、転換は隣接単位の終点を描き出し、その結果、欠失形成は不連続単位の消失に傾く。従って、本方法に関しては配列が同じ方向にあることが好ましい。任意の方向の擬反復配列は再組合せ効率の損失をもたらし、他方、一定方向の配列は高効率を提供する。しかしながら、少数の連続配列しか同一方向に持たないことは効率を低下させるものの、新規分子の効率的な回収にまだ十分な適応性を示すことができる。構築物を同一方向にある、ある程度反復された配列で構成して高効率とすることができる。
【0173】
配列は以下のものを含む、種々の方法のいずれかを用いてヘッドからテール方向に集合させることができる:
a)作成時に一本鎖が方向をなすポリAヘッドおよびポリTテールを含むプライマーが利用できる。これはRNAから作られるプライマーの最初の数塩基を持つことにより達成され、従ってRNアーゼHが容易に除去される。
【0174】
b)特有の制限切断部位を含むプライマーが利用できる。複数の部位、一連の特有の配列、ならびに反復合成および連結工程が必要とされる。
【0175】
c)プライマー内部の数塩基をチオレート化することができ、エキソヌクレアーゼを用いて適切なテールを有する分子を作製することができた。
【0176】
再組合せされた配列の回収は縮小RIによってクローニングベクターを同定することによる。再組合せされたコード配列をその後増幅して回収することができる。その産物を再びクローン化して発現させる。縮小RIを用いたクローニングベクターの回収は、下記により行われる。
【0177】
1)構築物が複雑性を減少させた際に唯一安定して維持されるベクターの使用。
【0178】
2)物理的手段によって短縮されたベクターの物理的回収。この場合、クローニングベクターは標準的なプラスミド単離法を用いて回収され、アガロースゲル、または標準法を利用して低分子量を排除するカラムのいずれかによりサイズ分画する。
【0179】
3)インサートのサイズが小さくなった場合に選択可能な、分断された遺伝子を含むベクターの回収。
【0180】
4)発現ベクターと適切な選択を用いた直接選択技術の使用。
【0181】
近縁生物に由来するコード配列(例えば遺伝子)は、高度の相同性を示し、かつ全く異なったタンパク質産物をコードする。これらの型の配列は本発明において、擬反復型として特に有用である。しかしながら、以下に示される実施例では、ほぼ同じ原型のコード配列(擬反復)の再組合せが示されているが、このプロセスはこのようなほぼ同じ反復に限られるものではない。
【0182】
以下の実施例は本発明の方法を示すものである。3つの特有の種に由来する核酸をコードする配列(ある程度の反復)を示す。各配列は一組の異なる特性を持つタンパク質をコードする。この配列はそれぞれ、「A」、「B」および「C」と表される配列内の特有の位置の1つまたは数個の塩基対が異なっている。擬反復配列は個別にまたはまとめて増幅され、連結されて、連結した分子集団中ですべての可能な順列および組合せが得られるような無作為な集合体となる。擬反復単位の数は構築条件によって制御できる。ある構築物での擬反復単位の平均数を反復指数(RI)と定義する。
【0183】
一度形成されれば構築物は、公開されているプロトコルに従ってアガロースゲルでサイズ分画してもしなくともよく、クローニングベクターへ挿入し、適当な宿主細胞にトランスフェクトする。次いでこの細胞を増殖させて、「減少性再組合せ」を行う。減少性再組合せ過程の速度は、所望によりDNA損傷を導入することで刺激され得る。RIの縮小が、「分子内」機構によって反復配列間で欠失が形成されることによるものか、「分子間」機構を通じて組換えに似た結果が起こることによるものかは重要ではない。最終的な結果はあり得るすべての組合せへ分子を再編成することである。
【0184】
場合によって本方法は、例えばタンパク質性受容体、ペプチドオリゴ糖、ビリオン(viron)、または他の所定の化合物または構造物といった所定の高分子と結合するか、または相互作用する(例えば、触媒性抗体など)能力を持つ個々のシャッフルされたライブラリーメンバーを同定するためのシャッフルされたプールのライブラリーメンバーをスクリーニングするさらなる工程を含んでなる。
【0185】
かかるライブラリーから同定された展示ポリペプチド、抗体、模倣ペプチド抗体、および可変領域配列は、治療、診断、研究、および関連する目的(例えば、触媒、水溶液の浸透性を上昇させる溶質など)に使用でき、および/または1以上のさらなるシャッフリングおよび/または親和性選択のサイクルに付すことが可能である。本方法は、表現型(例えば、触媒活性、安定性、酸化耐性、薬剤耐性、または宿主細胞に付与される検出可能な表現型)の特徴を選択する工程が所定の分子に対する結合親和性以外のものとなり得るように改変することができる。
【0186】
本発明は親和性相互作用スクリーニングに好適な展示抗体のライブラリーを作製する方法を提供する。この方法は、(1)まず、展示抗体および該展示抗体をコードする関連ポリヌクレオチドを含んでなる、複数の選択されるライブラリーメンバーを取得し、さらに該展示抗体をコードする該関連ポリヌクレオチドを取得して、該関連ポリヌクレオチドまたはそのコピーを取得すること(ここで、該関連ポリヌクレオチドは実質的に同一の可変領域枠組み配列の領域を含んでなる)、および(2)該ポリヌクレオチドを好適な宿主細胞に導入し、組換えおよび減少性再組合せを促進しシャッフルされたポリヌクレオチドを得る条件下でこの細胞を増殖させること、を含んでなる。このシャッフルされたプールに包含されるCDRの組合せは最初の複数の選択ライブラリーメンバーには存在せず、該シャッフルされたプールはCDR置換を含んでなる展示抗体ライブラリーを構成し、親和性相互作用スクリーニングに適している。場合により、該シャッフルされたプールを親和性スクリーニングに付し、所定のエピトープ(抗原)に結合するライブラリーメンバーを選択し、それにより複数の選択されたシャッフルされたライブラリーメンバーを選択する。さらに、複数の選択的にシャッフルされたライブラリーメンバーをシャッフルし、所望の結合親和性を有するライブラリーメンバーが得られるまで1〜1000サイクル、または望むだけ繰り返しスクリーニングすることができる。
【0187】
本発明の別の態様では、組換えまたは再編成の前またはその間に、本発明の方法により作製したポリヌクレオチドを、元のポリヌクレオチドへの突然変異の導入を促進する薬剤またはプロセスに付し得るものと考えられる。かかる突然変異の導入は、得られるハイブリッドポリヌクレオチドおよびそれからコードされるポリペプチドの多様性を高めるであろう。突然変異誘発を促進する薬剤またはプロセスとしては、限定されるものではないが、(+)−CC−1065、または(+)−CC−1065−(N3−アデニン)(SunおよびHurley, 1992を参照)のような合成類似体、DNA合成阻害することができるN−アセチル化または脱アセチル化4’−フルオロ−4−アミノビフェニル付加物(例えば、van de Pollら, 1992を参照)、またはDNA合成を阻害することができるN−アセチル化または脱アセチル化4−アミノビフェニル付加物(これもvan de Pollら, 1992, 751−758頁を参照)、三価クロム、三価クロム塩、7−ブロモメチル−ベンズ[a]アントラセン(「BMA」)、トリス(2,3−ジブロモプロピル)ホスフェート(「Tris−BP」)、1,2−ジブロモ−3−クロロプロパン(「DBCP」)、2−ブロモアクロレイン(2BA)、ベンゾ[a]ピレン−7,8−ジヒドロジオール−9−l0−エポキシド(「BPDE」)、プラチナ(II)ハロゲン塩、N−ヒドロキシ−2−アミノ−3−メチルイミダゾ[4,5−f]−キノリン(「N−ヒドロキシ−IQ」)、およびN−ヒドロキシ−2−アミノ−1−メチル−6−フェニルイミダゾ[4,5−f]−ピリジン(「N−ヒドロキシ−PhIP」)などのDNA複製を阻害することができる多環式芳香族炭化水素(「PAH」)DNA付加物である。特に望ましいのは紫外線(+)−CC−1065および(+)−CC−1065−(N3−アデニン)からなるPCR増幅を減退もしくは停止する手段である。特に包含される手段としては、DNA付加物、またはポリヌクレオチドまたはポリヌクレオチドプールから得られたDNA付加物を含んでなるポリヌクレオチドがあり、これはさらなるプロセッシングに先立ちポリヌクレオチドを含んでなる溶液を加熱することを含む工程により遊離もしくは除去することが可能である。
【0188】
別の態様では、本発明はハイブリッドポリヌクレオチドまたは再組合せポリヌクレオチドの製造を提供する本発明に従う条件下で、野生型タンパク質をコードする二本鎖の鋳型ポリヌクレオチドを含んでなるサンプルを処理することにより、生物学的活性をもつ組換えタンパク質を製造する方法に向けられる。
【0189】
本発明はまた、ウイルス遺伝子(例えばキャプシドタンパク質、スパイク糖タンパク質、ポリメラーゼ、およびプロテアーゼ)またはウイルスゲノム(例えばパラミクソウイルス、オルトミクソウイルス、ヘルペスウイルス、レトロウイルス、レオウイルスおよびライノウイルス)の集団をシャッフルするためのポリヌクレオチドシャッフルの使用を提供する。ある実施形態では、本発明は、組換えにより作製された新規なエピトープと同様にエピトープの新規な組合せを作製するため、免疫原性ウイルスタンパク質のすべてまたは一部をコードする配列をシャッフルする方法を提供するものであるが、かかるシャッフルされたウイルスタンパク質はエピトープもしくはエピトープの組合せ、ならびに組換えによって作製された新規なエピトープを含んでなり、かかるシャッフルされたウイルスタンパク質は、ウイルス進化の結果として自然環境で生じ得るエピトープ、またはエピトープの組合せ(例えば、インフルエンザウイルス株の組換えなど)を包含する。
【0190】
本発明はまた、遺伝子治療ベクターおよび複製欠陥遺伝子治療構築物を作製するためのポリヌクレオチド配列のシャッフリングに好適な方法を提供する。かかる方法を、DNAに基づくワクチン導入のためのワクチンベクター、ならびに抗腫瘍遺伝子治療およびその他の一般的治療方式を含む、ヒト遺伝子治療に使用することができるが、それらに限定されない。
【0191】
本明細書で用いられるポリペプチドの注釈としては、標準的な用法および慣例に従い、左手方向がアミノ末端方向で、右手方向がカルボキシ末端方向である。同様に、特に断りのない限り、一本鎖ポリヌクレオチド配列の左側の末端が5’末端であり、二本鎖ポリヌクレオチド配列の左手方向を5’方向とする。未完成のRNA転写物の5’→3’付加の方向を転写方向と呼び、RNAと同じ配列を持つDNA鎖上の配列領域でRNA転写物の5’→5’末端であるものを「上流配列」と呼び、RNAと同じ配列を持つDNA鎖上の配列領域でコード鎖RNA転写物の3’→3’末端であるものを「下流配列」と呼ぶ。
【0192】
方法論
核酸シャッフリングは、一つもしくは複数のポリヌクレオチドを生成するための、短いまたは小さいポリヌクレオチドのプールのin vitroまたはin vivo相同的組換え方法である。近縁の核酸配列またはポリヌクレオチドの混合物を有性PCRに付して、ランダムヌクレオチドを作製し、再集合させて、組換え体ハイブリッド核酸分子またはポリヌクレオチドのライブラリーもしくは混合集団を取得する。
【0193】
カセット突然変異誘発とは対照的に、シャッフリングおよび誤りがちな(Erro−prone)PCRだけが、配列のプールをブラインド方式で(プライマー以外の配列情報なしに)突然変異させることができる。
【0194】
反復選択を目的とする誤りがちなPCR単独に対する、本発明の突然変異誘発シャッフリングの利点は、抗体工学からの一例により、極めて明瞭に説明することができる。誤りがちなPCR(有性PCRではない)と比較して、DNAシャッフリングを考える。選択したプール配列の初期ライブラリーは、多様な起原(すなわち、ナイーブmRNA由来の抗体)の近縁配列から成るか、あるいは、単一の抗体遺伝子のあらゆるタイプの突然変異誘発(シャッフリングを含む)によって得ることができる。1回目の親和性選択の後に、選択した相補性決定領域(CDR)のコレクションを得る。図では、濃厚なCDRが、抗体分子に、抗原に対する高い親和性を賦与する。シャッフリングにより、例えば、CDR1のすべてとCDR2のすべてとの、CDR3のすべてとの自由な組合せ会合が可能になる。
【0195】
この方法は、逆連鎖反応であるという点で誤りがちなPCRとは異なる。誤りがちなPCRでは、ポリメラーゼ出発部位の数と、分子の数が、指数関数的に増加する。しかし、ポリメラーゼ出発部位の配列と、分子の配列は、実質的に同じままである。これに対し、ランダムポリヌクレオチドの核酸再集合もしくはシャッフリングでは、出発部位の数およびランダムポリヌクレオチドの数(ただし、サイズではない)は、時間の経過と共に減少する。全プラスミド由来のポリヌクレオチドについては、理論上の終点は、単一の、大きな鎖状体(コンカテマー)分子である。
【0196】
交差は、相同性領域に起こることから、組換えは、第一に、同じ配列ファミリーのメンバー間に起こる。これによって、著しく不適合の(例えば、同じ抗原の異なるエピトープに対して向けられた)CDRの組合せがなくなる。同じ反応で、複数の配列ファミリーをシャッフルすることも可能である。さらに、シャッフリングは、一般に、例えば、CDR1が、CDR2の位置には存在しないように、相対順序を保存する。
【0197】
希有シャフラントは、多数の最良(例えば、親和性が最も高い)CDRを含む可能性がある。これらの希有シャフラントは、その高い親和性に基づいて、選択することができる。
【0198】
選択された100個の異なる抗体配列のプールからのCDRは、最高1,006通りの順列を入れ替えることができる。この多数の順列は、DNA配列の単一ライブラリーに呈示され得ない。従って、所望の配列長さおよび配列多様性に応じて、複数サイクルのDNAシャッフリングおよび選択が必要であると考えられる。
【0199】
これに対し、誤りがちなPCRは、同じ相対配列中に選択したCDRすべてを保持し、はるかに小さい突然変異体クラウド(cloud)を生成する。
【0200】
本発明の方法に使用できる鋳型ポリヌクレオチドは、DNAもしくはRNAでよい。それは、組換えまたは再集合しようとする遺伝子のサイズ、または、より短いもしくはより小さいポリヌクレオチドのサイズに応じて、長さは違ってくる。好ましくは、鋳型ポリヌクレオチドは、50bp〜50kbである。関心のあるタンパク質をコードする核酸を含有する全ベクターを本発明の方法で使用することができ、実際に、好適に使用されている。
【0201】
鋳型ポリヌクレオチドは、PCR反応(米国特許第4,683,202号及び同第4,683,195号)を用いた増幅、または、その他の増幅もしくはクローニング方法によって、得ることができる。しかし、PCR産物のプーリングおよび有性PCRに付す前に、PCR産物からの遊離プライマーを除去することにより、さらに効率的な結果が得られる。有性PCRの前に、元のプールからプライマーを適切に除去しなかった場合には、交差クローンの頻度の低下を招く恐れがある。
【0202】
鋳型ポリヌクレオチドは、多くの場合二本鎖とすべきである。二本鎖核酸分子は、得られた一本鎖ポリヌクレオチドが、互いに相補的であり、従って、ハイブリダイズして、二本鎖分子を形成するのを確実にする上で、推奨される。
【0203】
鋳型ポリヌクレオチドに対する同一性領域および鋳型ポリヌクレオチドに対する異種性領域を有する一本鎖または二本鎖の核酸ポリヌクレオチドは、このステップで、鋳型ポリヌクレオチドに添加することができる。また、このステップで、二つの異なるが、近縁のポリヌクレオチド鋳型を混合することも考えらえる。
【0204】
二本鎖ポリヌクレオチド鋳型、ならびに、あらゆる添加した二本鎖または一本鎖ポリヌクレオチドに、減速または停止を含む有性PCRを実施することにより、約5bp〜5kb以上の混合物を得る。好ましくは、ランダムポリヌクレオチドのサイズは、約10bp〜1,000bp、さらに好ましくは、ポリヌクレオチドのサイズは、約20bp〜500bpである。
【0205】
あるいは、本発明の方法で、複数のニックを有する二本鎖核酸を使用してもよい。ニックは、二本鎖核酸の一本鎖部分の切れ目である。ニック間の距離は、好ましくは、5bp〜5kb、さらに好ましくは、10bp〜1,000bpである。これは、自己プライマー化領域をもたらし、例えば、ランダムプライマーから得られるポリヌクレオチドと共に含めるべき、さらに短い、もしくは、小さいポリヌクレオチドを生成することができる。
【0206】
いずれの特異的ポリヌクレオチドの濃度も、ポリヌクレオチド全量の1重量%以下、さらに好ましくは、いずれの特定核酸配列の濃度も、核酸全量の0.1重量%以下とする。
【0207】
混合物中の様々な特異的ポリヌクレオチドの数は、少なくとも約100、好ましくは、少なくとも約500、さらに好ましくは、約1,000である。
【0208】
このステップで、合成もしくは天然に拘わらず、一本鎖または二本鎖のポリヌクレオチドを、ランダム二本鎖の短いまたは小さいポリヌクレオチドに添加し、ポリヌクレオチド混合物の不均質性を高めることができる。
【0209】
また、このステップで、二本鎖の、ランダムに切断されたポリヌクレオチドの集団を、有性PCR工程で得たポリヌクレオチドと混合または組み合わせて、任意で、1以上の追加の有性PCRサイクルに付してもよい。
【0210】
鋳型ポリヌクレオチドへの突然変異の挿入を望む場合には、鋳型ポリヌクレオチドに対する同一性領域、ならびに、鋳型ポリヌクレオチドに対する異種性領域を有する一本鎖または二本鎖ポリヌクレオチドを、全核酸に対して20倍過剰の量で添加する。さらに好ましくは、一本鎖ポリヌクレオチドを、全核酸に対して10倍過剰の量で添加する。
【0211】
異なるが、近縁の鋳型ポリヌクレオチドの混合物を望む場合には、各々の鋳型に由来するポリヌクレオチドの集団を、約1:100より低い比で組み合わせる。この比は、さらに好ましくは、約1:40より低くする。中立突然変異(例えば、選択される表現型の特性に不要な変化をもたらす突然変異)を除去するために、例えば、突然変異したポリヌクレオチド集団を用いた、野生型ポリヌクレオチドの戻し交雑が望ましい場合もある。このような例では、ランダムに提供された有性PCRサイクルハイブリッドポリヌクレオチドに添加できる、ランダムに提供された野生型ポリヌクレオチドの比は、約1:1から約100:1、さらに好ましくは、1:1から40:1である。
【0212】
ランダムポリヌクレオチドの混合集団を変性し、一本鎖ポリヌクレオチドを形成した後、再アニーリングする。他の一本鎖ポリヌクレオチドとの相同性領域を有する一本鎖ポリヌクレオチドだけが、再アニーリングする。
【0213】
ランダムポリヌクレオチドは、加熱により変性することができる。当業者であれば、二本鎖核酸を完全に変性するのに必要な条件を決定することができるだろう。好ましくは、温度は80〜100℃、さらに好ましくは、90〜96℃の間である。これ以外に、ポリヌクレオチドを変性するのに用いられる手段としては、圧力(36)およびpHがある。
【0214】
ポリヌクレオチドは、冷却により再アニーリングしてもよい。好ましくは、温度は、20℃〜75℃、さらに好ましくは、40℃〜65℃の間である。平均4個のみの相同性の連続した塩基に基づいて、高い頻度の交差が必要な場合には、低いアニーリング温度を用いて、組換えを強制的に実施することができるが、この方法は難しくなる。後に起こる復元の度合いが、一本鎖ポリヌクレオチドの集団間の相同性の度合いに左右されるだろう。
【0215】
復元は、ポリエチレングリコール(PEG)または塩の添加により加速することができる。塩濃度は、好ましくは、0mM〜200mM、さらに好ましくは、塩濃度は、10mM〜100mmである。塩は、KClまたはNaClでよい。PEGの濃度は、好ましくは、0%〜20%、さらに好ましくは、5%〜10%である。
【0216】
次に、アニーリングしたポリヌクレオチドを、核酸ポリメラーゼとdNTP(すなわち、dATP、dCTP、dGTPおよびdTTP)の存在下にインキュベートする。核酸ポリメラーゼは、クレノウ断片、Taqポリメラーゼ、または、その他の当業者には公知のDNAポリメラーゼでよい。
【0217】
集合(assembly)に用いる手法は、まだ交差をもたらすであろう最小限度の相同性に応じて異なる。同一性の領域が広い場合には、Taqポリメラーゼを使用し、アニーリング温度を45〜65℃とする。同一性領域が狭い場合には、クレノウポリメラーゼを用いて、アニーリング温度を20〜30℃にする。当業者であれば、アニーリング温度を調節して、達成する交差の数を増やすことができるだろう。
【0218】
ポリメラーゼは、アニーリングの前、アニーリングと同時に、あるいはアニーリング後に添加することができる。
【0219】
変性、復元、ならびに、ポリメラーゼの存在下でのインキュベートのサイクルをここでは、核酸のシャッフリングもしくは再集合と呼ぶ。このサイクルを所望の回数だけ繰り返す。好ましくは、このサイクルを2〜50回、さらに好ましくは、10〜40回繰り返す。
【0220】
得られる核酸は、約50bp〜約100kbの大きい二本鎖ポリヌクレオチド、好ましくは、この大きいポリメラーゼは、500bp〜50kbである。
【0221】
この大きいポリヌクレオチドは、鋳型ポリヌクレオチドと同じサイズのポリヌクレオチドのコピーをタンデムで含んでいる可能性がある。次に、この鎖状体ポリヌクレオチドを鋳型ポリヌクレオチドの単一コピーに変性する。その結果、サイズが鋳型ポリヌクレオチドとほぼ同じポリヌクレオチドの集団が得られる。この集団は、同一性領域と異種性領域を有する一本または二本鎖ポリヌクレオチドが、シャッフリング前に鋳型ポリヌクレオチドに添加された混合集団である。
【0222】
次いで、これらのポリヌクレオチドを、適したベクターにクローニングし、連結反応混合物を用いて、細菌を形質転換する。
【0223】
鎖状体(コンカテマー)の消化ではなく、PCR(米国特許第4,683,195号および同第4,683,202号)を含む様々な方法により、クローニング前に、単一ポリヌクレオチドを増幅することによって、大きい鎖状体ポリヌクレオチドから、単一ポリヌクレオチドを作製することができると考えられる。
【0224】
クローニングに用いるベクターは、所望のサイズのポリヌクレオチドを受容するものであれば、特に限定しない。特定のポリヌクレオチドの発現を所望する場合には、クローニング運搬体は、宿主細胞中のポリヌクレオチドの発現を可能にするために、ポリヌクレオチドの挿入部位に隣接して、転写および翻訳シグナルを含んでいなければならない。好ましいベクターとして、プラスミドのpUC系列およびpBR系列がある。
【0225】
このようにして得られる細菌集団は、ランダム突然変異を有する多数の組換え体ポリヌクレオチドを含む。この混合集団を試験して、所望の組換え体ポリヌクレオチドを同定することができる。この選択方法は、所望するポリヌクレオチドに応じて異なる。
【0226】
例えば、リガンドに対する結合効率が高いタンパク質をコードするポリヌクレオチドを所望する場合には、集団またはライブラリー中のポリヌクレオチドの各部分により発現されるタンパク質が、リガンドに結合する能力を、当業者には公知の様々な方法(すなわち、パンニング、アフィニティ・クロマトグラフィー)で試験される。薬剤耐性の高いタンパク質をコードするポリヌクレオチドを所望する場合には、集団またはライブラリー中のポリヌクレオチドの各々によって発現されるタンパク質が、宿主生物に薬剤耐性を賦与する能力を試験される。当業者にとって、所望するタンパク質の情報が得られれば、上記集団を試験することによって、該タンパク質に所望の特性を賦与するポリヌクレオチドを同定することは容易であろう。
【0227】
当業者は、タンパク質の断片をファージ表面に融合タンパク質として発現するファージ展示系(Pharmacia、ウィスコンシン州ミルウォーキー)を使用することができる。融合タンパク質(その一部が組換え体DNA分子によってコードされる)の転写を起こす部位で、該組換え体DNA分子をファージDNAにクローニングする。組換え体核酸分子を含むファージは、細胞内で、複製および転写を受ける。融合タンパク質のリーダー配列は、融合タンパク質の輸送を、ファージ粒子の先端に向ける。このようにして、組換え体DNA分子により部分的にコードされる融合タンパク質がファージ粒子上に展示され、前述の方法により検出および選択する。
【0228】
さらに、所望の組換え体タンパク質をコードするDNAを含む第1集団のサブ集団由来のポリヌクレオチドに対して、複数の核酸シャッフリングサイクルを実施してもよい。この方法では、これまでより高い結合親和性もしくは酵素活性を有するタンパク質を達成できる可能性がある。
【0229】
また、野生型ポリヌクレオチドと、第1ラウンド、もしくは、それに続くラウンドの核酸シャッフリングから得た核酸サブ集団との混合物に対して、複数の核酸シャッフリングサイクルを実施することにより、サブ集団からサイレント突然変異を除去することも可能である。
【0230】
精製された状態のあらゆる核酸の供給源を出発核酸として使用することができる。従って、この方法では、DNA、または、メッセンジャーRNAを含むRNAを使用することができ、また、これらDNAもしくはRNAは、一本鎖でも二本鎖でもよい。さらに、それぞれの一本鎖を含むDNA−RNAハイブリッドを用いてもよい。核酸配列は、突然変異を起こそうとする核酸配列のサイズに応じて、長さが違ってくる。好ましくは、特定核酸配列は、50〜50,000塩基対である。本発明の方法に、関心のあるタンパク質をコードする核酸を含むベクターを使用することも考えられる。
【0231】
核酸は、あらゆる供給源、例えば、pBR322のようなプラスミド、クローン化したDNAまたはRNA、もしくは、細菌、酵母、ウイルス、ならびに、植物や動物等の高等生物を含むあらゆる採取源からの天然DNAまたはRNAから取得してものでよい。DNAまたはRNAは、血液または組織材料から採取してもよい。鋳型ポリヌクレオチドは、ポリヌクレオチド連鎖反応を用いた増幅(PCR、米国特許第4,683,202号および同第4,683,195号)により得ることができる。あるいは、ポリヌクレオチドは、細胞に存在するベクターに含まれるものでもよく、細胞を培養し、当業者には公知の方法により、細胞から核酸を採取することによって、十分な核酸を得ることができる。
【0232】
どのような特定の核酸配列も、本発明の方法によりハイブリッド集団を生成するのに使用することができる。唯一必要なのは、特定核酸配列のハイブリッド配列の小集団が、本方法の前に存在する、もしくは作製されることである。
【0233】
突然変異を有する特定核酸配列の初期小集団は、多数の様々な方法によって作製することができる。突然変異は、誤りがちなPCRによって発生させてもよい。誤りがちなPCRは、忠実度の低い重合条件を用いて、長い配列にわたって、低いレベルの点突然変異をランダムに導入する。あるいは、突然変異は、オリゴヌクレオチド指令突然変異誘発によって、鋳型ポリヌクレオチドに導入することもできる。オリゴヌクレオチド指令突然変異誘発では、ポリヌクレオチドから、制限酵素消化を用いて、短い配列のポリヌクレオチドを除去し、合成ポリヌクレオチドと置換する。この合成ポリヌクレオチドでは、元の配列から、様々な塩基が変化させてある。また、上記ポリヌクレオチド配列は、化学的突然変異誘発によって変化させることも可能である。化学的突然変異誘発原には、例えば、重亜硫酸ナトリウム、亜硝酸、ヒドロキシルアミン、ヒドラジンまたはギ酸等が含まれる。ヌクレオチド前駆体の類似体であるその他の薬剤として、ニトロソグアニジン、5−ブロモウラシル、2−アミノプリン、もしくはアクリジンが挙げられる。一般に、これら薬剤は、ヌクレオチド前駆体の代わりに、PCR反応に添加し、これによって、配列に突然変異を起こす。また、プロフラビン、アクリフラビン、キナクリン等のインターカレート剤を使用してもよい。ポリヌクレオチドのランダム突然変異誘発は、X線または紫外線の照射により達成することもできる。一般に、このように突然変異を誘発させたプラスミドポリヌクレオチドを大腸菌(E. coli)に導入し、ハイブリッドプラスミドのプールまたはライブラリーとして増殖させる。
【0234】
あるいは、特定核酸の小混合集団は、自然界に見いだすことができ、この場合、これら核酸は、同じ遺伝子、もしくは、異なる近縁種由来の同じ遺伝子(すなわち、コグネイト遺伝子)の様々な対立遺伝子から成り得る。あるいはまた、これら核酸は、例えば、免疫グロブリン遺伝子等、1つの種に認められる類縁DNA配列であることもある。
【0235】
特定核酸配列の混合集団を生成したら、ポリヌクレオチドを直接使用するか、もしくは、当業者には公知の方法で、適切なクローニングベクターに挿入することができる。
【0236】
ベクターの選択は、ポリヌクレオチド配列のサイズ、ならびに、本発明の方法で用いる宿主細胞に応じて行う。本発明の鋳型は、プラスミド、ファージ、コスミド、ファージミド、ウイルス(例えば、レトロウイルス、パラインフルエンザウイルス、ヘルペルウイルス、レオウイルス、パラミクソウイルス等)、あるいはそれらの選択部分(例えば、コートタンパク質、スパイク(spike)糖タンパク質、キャプシドタンパク質)でよい。例えば、突然変異を起こそうとする特定核酸配列が大きい場合には、コスミドおよびファージミドが好ましい。というのは、これらのベクターは、大きなポリヌクレオチドを安定して増やすことができるからである。
【0237】
特定核酸配列の混合集団をベクターにクローニングする場合には、宿主細胞に各ベクターを挿入し、宿主細胞にベクターを増幅させることによって、クローン的に増幅することができる。これは、核酸配列の絶対数が増加するのに対し、ハイブリッドの数は増えないために、クローン増幅と呼ばれる。発現ポリヌクレオチドをスクリーニングすることにより、有用性を容易に判定することができる。
【0238】
本発明のDNAシャッフリング法は、未知の配列のプールについて、ブラインド方式で実施することができる。再集合混合物にオリゴヌクレオチド(再集合させる配列と相同性の末端を有する)を添加することにより、どんな特定の位置ででも、あらゆる配列混合物を別の配列混合物に組み込むことができる。従って、合成オリゴヌクレオチドの混合物、PCRポリヌクレオチドの混合物、あるいは、全遺伝子の混合物さえも、規定した位置で、別の配列ライブラリーに混合することができると考えられる。1つの配列の挿入(混合)は、鋳型の別の部分への配列の挿入とは無関係である。このように、組換え度、要求される相同性、ならびに、ライブラリーの多様性は、再集合したDNAの長さに沿って、独立してかつ同時に変えることができる。
【0239】
二つの遺伝子を混合するこの手法は、マウスハイブリドーマ由来の抗体のヒト化に有用である。二つの遺伝子を混合する、もしくは、代替配列を遺伝子に挿入する手法は、治療に用いられているあらゆるタンパク質、例えば、インターロイキンI、抗体、tPAおよび成長ホルモンに有用である。また、この手法は、発現を高める、あるいはタンパク質の発現の特異性を変化させる上で、あらゆる核酸、例えば、プロモーターもしくはイントロン、または、遺伝子の31非翻訳領域または51非翻訳領域において有用である。また、この手法を使用して、リボザイムまたはアプタマーに突然変異を起こすこともできる。
【0240】
シャッフリングには、多様性領域を分離する相同性領域の存在が必要である。シャッフリングには、スカフォールド(scaffold)様タンパク質構造が特に適している。保存されたスカフォールドが、自己会合による全体的なフォールディングを決定すると同時に、特異的結合を媒介する比較的制限されていないループを展示する。このようなスカフォールドの例として、当業者には公知の免疫グロブリンβバレル、ならびに4ヘリックス束がある。このシャッフリングを使用して、結合のための突然変異配列の様々な組合せを有するスカフォールド様タンパク質を生成することができる。
【0241】
飽和突然変異誘発
1つの態様では、本発明は、ポリヌクレオチドに点突然変異を導入し、単一のアミノ酸置換の全範囲が各アミノ酸の位置で表される一連の子孫ポリペプチドを作出するための特許コドンプライマー(縮重したN、N、G/T配列を含む)の使用を提供する。使用されるオリゴは第1の相同配列、縮重したN、N、G/T配列、および好ましいが必ずしも必要ではない第2の相同配列を隣接して包含する。N、 N、G/T配列の縮重は20種類のアミノ酸すべてのコドンを含むので、かかるオリゴの使用から得られる下流の子孫翻訳産物は、ポリペプチドに沿ったそれぞれのアミノ酸部位で可能性のあるすべてのアミノ酸変化を含む。
1つの態様では、かかる1つの縮重オリゴ(1つの縮重N、N、G/Tカセットを含んでなる)は、親ポリヌクレオチド鋳型中の各原型コドンに全範囲のコドン置換を受けさせるのに用いられる。別の態様では、同じオリゴ内であろうとなかろうと、少なくとも2つの縮重N、N、G/Tカセットを使用して、親ポリヌクレオチド鋳型の少なくとも2つの原型コドンに全範囲のコドン置換を受けさせる。このように、2以上のN、N、G/T配列が1つのオリゴに含まれれば、2以上の部位でアミノ酸突然変異を導入することができる。この複数のN, N, G/T配列は直接隣接していてもよいし、または1以上のさらなるヌクレオチド配列により分離されていてもよい。もう1つの態様では、付加および欠失の導入に役立つオリゴを、単独でまたはN、N、G/T配列を含むコドンと組み合わせて用い、アミノ酸の付加、欠失および/もしくは置換のいずれかの組合せまたは順列を導入することができる。
【0242】
特に例示すれば、隣接するN、N、G/Tトリプレット、すなわち縮重した(N、 N、G/T)配列を含むオリゴを用いて、2以上の隣接するアミノ酸位置に同時に突然変異を誘発することが可能である。
【0243】
もう1つの態様では、本発明は、N、N、G/T配列よりも縮重の少ない縮重カセットの使用を提供する。例えば、いくつかの例では、1個のN(このNはトリプレットの1番目、2番目または3番目の位置に存在し得る)のみを含む縮重トリプレット配列を使用する(例えばオリゴ内で)ことが望ましい。いずれかの組合せおよびその順列を含む他の塩基はいずれもトリプレットの2つの位置を残して使用できる。あるいは、いくつかの例では、縮重したN、N、Nトリプレット配列またはN、N、G/Cトリプレット配列を使用する(例えばオリゴ内で)のが望ましい。
【0244】
しかし、本発明で開示されるように縮重トリプレット(N、N、G/TまたはN、N、G/Cトリプレット配列など)の使用にはいくつかの理由で利点があると考えられる。1つの態様では、本発明は、可能性のあるアミノ酸(20種類のアミノ酸の全て)の全範囲の、ポリペプチド中の各アミノ酸への、またアミノ酸の位置ごとの置換を系統的かつ極めて容易にもたらす手段を提供する。従って、100のアミノ酸ポリペプチドに対して本発明は、2000の異なる種(すなわち、位置につき20の可能性あるアミノ酸×100のアミノ酸位置となる)を系統的かつ極めて容易に作出する手段を提供する。縮重N、N、G/TまたはN、N、G/Cトリプレット配列を含むオリゴを使うことにより、20種類の可能性あるアミノ酸をコードする32の独立する配列が提供されると考えられる。従って、かかる1つのオリゴを用いて親ポリヌクレオチド配列が飽和突然変異誘発を受ける反応槽内では、20の異なるポリペプチドをコードする32の異なる子孫ポリヌクレオチドが生じる。これに対し、部位特異的突然変異誘発で非縮重オリゴを使用すると、反応槽につきたった1つの子孫ポリペプチド産物しか得られない。
【0245】
本発明はまた、場合により開示された縮重プライマーと併用できる非縮重オリゴの使用を提供する。状況によっては、非縮重オリゴを用いて実施中のポリヌクレオチドに特異的な点突然変異を作製することが有利であると考えられる。これは特異的なサイレント点突然変異、対応するアミノ酸を変化をもたらす点突然変異、および停止コドンの生成と対応するポリペプチド断片の発現を引き起こす点突然変異を作出する手段を提供する。
【0246】
従って、本発明の好ましい実施形態では、各々の飽和突然変異誘発反応槽は、少なくとも20の子孫ポリペプチド分子をコードするポリヌクレオチドを含有するので、20のアミノ酸すべてが親ポリヌクレオチド内で突然変異を誘発したコドンの位置に対応する1つの特異的なアミノ酸位置で表される。各々の飽和突然変異誘発反応槽から生じた32倍の縮重した子孫ポリペプチドをクローン増幅に付し(例えば、発現ベクターを用いて好適な大腸菌宿主へクローン化する)、発現スクリーニングに付すことができる。スクリーニングにより個々の子孫ポリペプチドが、(親ポリペプチドと比較して)好ましい特性変化を示すことが同定されると、それに応じてそこに含有される好ましいアミノ酸置換の同定のために配列決定することが可能である。
【0247】
本明細書で開示された飽和突然変異誘発を用いた親ポリペプチド内で、各アミノ酸の位置、またアミノ酸ごとに突然変異を誘発する上で、好ましいアミノ酸変化を2以上のアミノ酸位置で同定することができると考えられる。これらの好ましいアミノ酸置換のすべてまたは一部の組合せを含む1以上の新しい子孫分子を作出できる。例えば、もし2つの特異的かつ好ましいアミノ酸変化が、ポリペプチド内の3つのアミノ酸の位置の各々で同定されるならば、各位置(元のアミノ酸からは変化せず、かつ、2つはそれぞれ好ましい変化)で3通りの可能性および3つの位置が順列に含まれる。従って、これまでに調べた7つ、すなわち6個の単一点突然変異(すなわち、3つの位置の各々で2つ)といずれの位置でも変化していなものを含め、3×3×3通りすなわち全体で27通りの可能性がある。
【0248】
さらにもう1つの態様では、部位飽和突然変異誘発はスクリーニングとともに、シャッフリング、キメラ化、組換えおよび他の突然変異誘発プロセスと併用できる。本発明は飽和突然変異誘発を含む反復法による任意の突然変異誘発法の使用を提供する。1つの例としては、任意の突然変異誘発法の反復使用がスクリーニングと併用される。
【0249】
従って、限定されるものではないが例として、本発明は、ハイブリッドポリヌクレオチドが組換えおよび減少性再組合せにより生じるように、2以上の関連ポリヌクレオチドを好適な宿主細胞へ導入する方法など、さらなる突然変異誘発法と組み合わせた飽和突然変異誘発の使用を提供する。
【0250】
ある遺伝子の全配列に沿って突然変異誘発を行うことに加えて、本発明は、ポリヌクレオチド配列内の任意の数の塩基をそれぞれ置換するのに使用することができる突然変異誘発を提供し、ここでは突然変異が誘発される塩基数は、15から100,000までのすべての整数であることが好ましい。従って、分子に沿って位置ごとに突然変異を誘発する代わりに、不連続な塩基数(好ましくは総計15から100,000までの部分集合)ごとに突然変異を起こすことが可能である。好ましくは、ポリヌクレオチド配列に沿ってそれぞれの位置あるいは位置の群を突然変異誘発するのに別個のヌクレオチドを使用する。突然変異誘発される3つの位置の1群は1つのコドンであってよい。突然変異は好ましくは突然変異誘発カセットとも呼ばれる異種カセットを含む突然変異誘発プライマーを用いて導入される。好ましいカセットは1〜500塩基を持ち得る。かかる異種カセットのそれぞれのヌクレオチド位置はN、A、C、G、T、A/C、A/G、A/T、C/G、C/T、G/T、C/G/T、A/G/T、A/C/T、A/C/GまたはEであり、EはA、C、GまたはT以外のいずれの塩基でもよい(Eはデザイナーオリゴ(designer oligo)と呼び得る)。下記の表は例示的なトリヌクレオチドカセットを示している(N、N、G/T;N、N、NおよびN、 N、A/Cの他に3000を越える可能性がある)。
【0251】
一般的な意味において、飽和突然変異誘発は、変異誘発させる規定のポリヌクレオチド配列(ここで変異誘発させる配列は好ましくは15〜100,000塩基長である)内の完全なセットの突然変異誘発カセット(各カセットは好ましくは1〜500塩基長である)を変異誘発することを含む。従って、突然変異群(1〜100の突然変異にわたる)が各カセットに導入されて変異誘発される。飽和突然変異誘発を1回おこなう間、1つのカセットへ導入される突然変異の群は、第2のカセットへ導入される第2の突然変異の群と異なっていてもよいし、あるいは同じであってもよい。かかる群の例としては、欠失、付加、特定のコドンの群、および特定のヌクレオチドカセットの群が挙げられる。
【0252】
変異誘発させる規定の配列(図20を参照)としては、好ましくは遺伝子全体、経路、cDNA、全オープンリーディングフレーム(ORF)、および完全なプロモーター、エンハンサー、リプレッサー/トランスアクチベーター、複製起点、イントロン、オペレーター、または任意のポリヌクレオチド官能基が挙げられる。一般に、この目的に好ましい「規定の配列」は15塩基のポリヌクレオチド配列および15塩基〜15,000塩基長のポリヌクレオチド配列(本発明はこの間の全ての整数に特に名前をつけている)を有する任意のポリヌクレオチドであってよい。コドンの群を選択するときには、縮重突然変異誘発カセットによりコードされるアミノ酸の種類を考慮する。
【0253】
突然変異誘発カセット(表1−85を参照)に導入可能な突然変異の群の特に好ましい例では、本発明は特に、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19および 20のアミノ酸を各位置にコードする縮重コドン置換(縮重オリゴを用いる)、およびそれによりコードされるポリペプチドライブラリーを提供する。
【0254】

Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
2.11.2.3.エキソヌクレアーゼ媒介の再集合
ある実施形態では、本発明は、少なくとも二つのポリヌクレオチドのシャッフリング、集合、再集合、組換え、および/または鎖状体化を行なって、子孫ポリヌクレオチド(例えば、発現して、ポリペプチドもしくは遺伝子経路を形成することのできるキメラ子孫ポリヌクレオチド)を生成する方法を提供する。ある実施形態では、二本鎖のポリヌクレオチド末端(例えば、互いをハイブリダイゼーションの相手としてハイブリダイズした二つの一本鎖配列)をエキソヌクレアーゼで処理し、二本の鎖の一方からヌクレオチドを遊離させ、その元の相手を含まない残った鎖を残存させ、所望であれば、残った鎖を、別の相手とのハイブリダイゼーションを達成するのに使用することができる。
【0255】
具体的には、二本鎖のポリヌクレオチド末端(ポリヌクレオチドまたは非ポリヌクレオチド配列の一部であるか、もしくは、これらに接続されている場合もある)をエキソヌクレアーゼ活性源にさらす。有用なエキソヌクレアーゼ活性源としては、3’エキソヌクレアーゼ活性を有する酵素、5’エキソヌクレアーゼ活性を有する酵素、3’エキソヌクレアーゼ活性および5’エキソヌクレアーゼ活性の両方を有する酵素、ならびに、これらのうちいずれかの組合せが挙げられる。エキソヌクレアーゼを用いて、線状二本鎖のポリヌクレオチドの一端または両端から、ならびに、3つ以上の末端を有する分枝ポリヌクレオチドの一端〜全末端から、ヌクレオチドを遊離させることができる。この遊離作用のメカニズムは、末端ヌクレオチドの酵素触媒による加水分解から成るものと考えられ、時間依存的に進行させ、酵素処理の進行を実験的に制御することができる。
【0256】
これに対し、非酵素的方法を使用して、ポリヌクレオチドビルディングブロックのシャッフリング、集合、再集合、組換え、および/または鎖状体化を行なうことができるが、これは、実施サンプルを変性(もしくは「融解」)条件(例えば、温度、pH、および/または塩度条件を変えることによる)に付し、二本鎖ポリヌクレオチドの実施セットをポリヌクレオチド一本鎖に融解することから成る。シャッフリングのためには、ポリヌクレオチド一本鎖が、ある程度まで、異なるハイブリダイゼーション相手とのアニールメントに参加する(すなわち、変性ステップの前に、前の相手であった者同士の間での排他的再アニールメントに単に逆戻りしない)ことが望ましい。しかし、反応容器中の、前のハイブリダイゼーション相手の存在は、元の二本鎖ポリヌクレオチドを再形成するための前の相手と一本鎖ポリヌクレオチドとの再アニールメントを妨害するわけではなく、時には、有利に働く場合もある。
【0257】
二本鎖ポリヌクレオチドのビルディングブロックを変性に付した後、アニールメントを実施することから成る上記の非酵素的シャッフリング方法とは対照的に、本発明は、さらに、変性を必要としないエキソヌクレアーゼに基づく手法を提供する。むしろ、変性条件の回避、ならびにアニーリングした(すなわち非変性)状態での二本鎖ポリヌクレオチド基質の維持が、エキソヌクレアーゼ(例えば、エキソヌクレアーゼIIIとredα遺伝子産物)の作用に必要な条件である。さらに、対照的に、他の一本鎖ポリヌクレオチド配列とハイブリダイズすることができる一本鎖ポリヌクレオチド配列の生成は、一方のハイブリダイゼーション相手における共有結合切断(従って、配列の破壊)の結果、起こる。例えば、エキソヌクレアーゼIII酵素を用いて、一本のハイブリダイゼーション鎖の3’末端ヌクレオチドを酵素により遊離させる(これによって、該ポリヌクレオチド鎖において共有結合加水分解を達成する)ことができる。これが、残った一本鎖と、新しい相手とのハイブリダイゼーションを促進する(前の相手は、共有結合切断にかけられたため)。
【0258】
さらに詳しく説明すると、3’エキソヌクレアーゼの例として、特定のエキソヌクレアーゼ、すなわち、エキソヌクレアーゼIIIが挙げられる。しかし、5’エキソヌクレアーゼ活性を有する酵素および3’エキソヌクレアーゼ活性を有する酵素、ならびに、まだ発見されていない酵素およびまだ開発されていない酵素等、その他のエキソヌクレアーゼを用いてもよい。特に、上に開示した手法のために、反応速度がさらに最適で、および/または、特異的活性がさらに高く、および/または、不要活性がさらに少ない、酵素の発見、最適化(例えば、定方向進化による)、あるいは発見および最適化の両方が可能であることに特に留意すべきである。実際、本発明が、このようなデザイナー酵素の発見および/または開発を奨励すると予想される。すなわち、本発明は、現在入手可能な多様なエキソヌクレアーゼ酵素、さらには、まだ発見されていない酵素や、まだ開発されていない酵素を用いて、実施可能である。
【0259】
エキソヌクレアーゼIIIのエキソヌクレアーゼ作用は、平滑であるか、あるいは5’オーバーハング(overhang)を有する実施二本鎖ポリヌクレオチド末端を必要とし、エキソヌクレアーゼ作用は、酵素により、3’末端ヌクレオチドを遊離させて、一本鎖5’末端を残す。この5’末端は、エキソヌクレアーゼ作用が進行するほど、長くなる(図1参照)。この手法により生成された5’オーバーハングを用いて、ハイブリダイゼーションを可能にするのに十分な相同性を共有する別の一本鎖ポリヌクレオチド配列(これもまた一本鎖ポリヌクレオチドでもよいし、あるいは、部分的に二本鎖のポリヌクレオチドの末端オーバーハングでもよい)にハイブリダイズすることもできる。これらエキソヌクレアーゼIIIにより生成した一本鎖配列(例えば、5’オーバーハングにおける)が、他の一本鎖配列にハイブリダイズする能力によって、2つ以上のポリヌクレオチドのシャッフリング、集合、再集合、および/または鎖状化が可能となる。
【0260】
さらに、必要に応じて、二本鎖ポリヌクレオチドの末端を保護する、あるいは、該末端が、有用なエキソヌクレアーゼの所望の酵素作用を受けやすくなるようにすることができる。例えば、3’オーバーハングを有する二本鎖ポリヌクレオチド末端は、エキソヌクレアーゼIIIのエキソヌクレアーゼ作用を受けにくい。しかし、様々な手段により、これが、エキソヌクレアーゼIIIのエキソヌクレアーゼ作用を受けやすくなるようにすることができる。例えば、該ポリヌクレオチドをポリメラーゼを用いた処理により平滑末端化する;該ポリヌクレオチドを切断して、平滑末端または5’オーバーハングを与える;別の二本鎖ポリヌクレオチドに結合(連結またはハイブリダイズ)して、平滑末端または5’オーバーハングを与える;一本鎖ポリヌクレオチドにハイブリダイズして、平滑末端または5’オーバーハングを与える;あるいは、様々な手段のいずれかにより修飾する。
【0261】
ある形態によれば、エキソヌクレアーゼを、線状二本鎖ポリヌクレオチドの一端または両端で作用させ、完全に、ほぼ完全に、もしくは部分的に進行させる。エキソヌクレアーゼ作用を完全に進行させると、各5’オーバーハングの長さが、「ランデブーポイント(rendezvous point)」(ポリヌクレオチド中心点近傍)と考えられる方向に、ポリヌクレオチドの中央領域に向かって、長く延びてくる。最後には、各々が、元の二本鎖ポリヌクレオチドの長さの約半分の一本鎖ポリヌクレオチド(解離することもできる)が生成される(図1)。あるいは、完全に進行させる前に、エキソヌクレアーゼ仲介反応を終了することも可能である。
【0262】
このように、このエキソヌクレアーゼ仲介手法は、ポリヌクレオチドのビルディングブロックのシャッフリング、集合、および/または再集合、組換え、ならびに鎖状体化を行なう上で有用である。尚、このポリヌクレオチドビルディングブロックは、10個までの塩基長、数十個の塩基長、数百個の塩基長、数千個の塩基長、数万個の塩基長、数十万個の塩基長または数百万個の塩基長、あるいは、それ以上の塩基長のものでもよい。
【0263】
このエキソヌクレアーゼ仲介手法は、大腸菌エキソヌクレアーゼIIIの二本鎖DNA特異的エキソデオキシリボヌクレアーゼ活性の作用に基づく。エキソヌクレアーゼIIIの基質は、二本鎖ポリヌクレオチドを断片化することにより生成することができる。断片化は、機械的手段(例えば、剪断、超音波処理等)、酵素的手段(例えば、制限酵素の使用)、ならびに、これらのいずれかの組合せにより達成することができる。これより大きいポリヌクレオチドの断片も、ポリメラーゼ仲介合成により得られる。
【0264】
エキソヌクレアーゼIIIは、28Kモノマー酵素、すなわち、大腸菌のxthA遺伝子の産物であり、次の4つの既知の活性を有する:エキソデオキシリボヌクレアーゼ(本書では、代わって、エキソヌクレアーゼと呼ぶ)、RNaseH、DNA−3’−ホスファターゼ、ならびにAPエンドヌクレアーゼ。エキソデオキシリボヌクレアーゼ活性は、二本鎖DNAに特異的である。作用のメカニズムは、3’末端から徐々に5’方向に向かってDNAの酵素加水分解を起こし、ヌクレオシド5’−リン酸と、残った一本鎖を形成すると考えられる。この酵素は、一本鎖DNA、一本鎖RNA、または二本鎖RNAの効率的な加水分解を示さないが、DNA−RNAハイブリッド中のRNAを分解してヌクレオシド5’−リン酸を放出する。この酵素はまた、DNAの3’ホスホモノエステル基から特異的に無機リン酸を放出するが、RNAまたは短いオリゴヌクレオチドからは放出しない。これらの基を除去することにより、末端がDNAポリメラーゼ作用のためのプライマーに変換される。
【0265】
エキソヌクレアーゼ活性を有する酵素の別の例として、レッドアルファおよびヘビ毒ホスホジエステラーゼがある。レッドアルファ(redα)遺伝子産物(ラムダエキソヌクレアーゼとも呼ばれる)は、バクテリオファージλに由来する。redα遺伝子は、左方向のプロモーターから転写され、その産物は組換えに関与する(24kD)。レッドアルファ遺伝子産物は、5’−リン酸化末端から前進的に作用して、二本鎖DNAからモノヌクレオチドを遊離させる(高橋および小林、1990)。ヘビ毒ホスホジエステラーゼ(Laskowski、1980)は、スーパーコイルドDNAを急速に開くことができる。
【0266】
関連性はあるが同一ではない核酸鎖は、キメラ分子の生成の1ステップとしてハイブリダイズすることができると考えられる。しかしながら、これらの核酸鎖はまったく同一ではないため、非同一核酸のアニールメントである、ヘテロ複合体(heteromeric complex)とでも呼ばれるものを形成することができる。この複合体においては、2つの異種鎖が部分的にハイブリダイズすることはあるが、著しく異種の鎖の末端配列はハイブリダイズしないと思われるため、これら異種鎖はハイブリダイズする可能性があるということになる。しかし、ハイブリダイズしない末端は、伸長を開始したり連結点として役立つためには最適とはいえないため、これは問題である。従って、別の実施形態では、本発明は、ヘテロ核酸複合体中のアニーリングさせた核酸鎖のハイブリダイズしていない一本鎖末端から3’末端ヌクレオチドおよび5’末端ヌクレオチドを遊離させ、短くされているがハイブリダイズした末端を残存させることにより処理末端のポリメラーゼに基づく伸長および/またはリガーゼ仲介型連結を促進する手段としてのエキソヌクレアーゼ処理の使用を提供する。この手順は、「解放された末端のプルーニング (pruning of loose ends)」と仮称されている。この「プルーニング」の目的のために、種々のエキソヌクレアーゼを使用することが可能である。本発明による「プルーニング」目的のための特に好ましいエキソヌクレアーゼ処理としては、ヤエナリ (Mung bean)ヌクレアーゼによる処理、S1ヌクレアーゼによる処理、およびE.Coli DNA による処理などがある。本発明による「プルーニング」目的のためのさらなる好ましいエキソヌクレアーゼ処理としては、以下に列挙する酵素の使用がある(選択した酵素の特質を選択的に提供する)。
【0267】
エキソヌクレアーゼ
Figure 2004500019
a. Stratagene
b. Promega
c. Epicenter
d. Roche
e. Kong, H.M., Kucera, R.B.., and Jack, W.E., (1993) J. Biol. Chem.
268, 1965−1975.
f. McClure, W.R. and Jovin, T.M., (1975) J. Biol. Chem 250, 4073−
4080.
g. Polesky A.H., Steitz, T.A., Grindley, N.D.F. and Joyce, C.M., (1990)
J. Biol. Chem. 265, 14579−14591.
h. Gillin, F.D. and Nossal, N.G., (1975) Biochem. Biophys. Res.
Commun. 64, 457−464.
i. Patel, S.S., Wond, E. and Johnson, K.A., (1991) Biochemistry 30,
511−525.
k. より高濃度の酵素で、両末端から切断するいくらかの二本鎖エキソヌ
クレアーゼ活性を示す
m.より高濃度の酵素で、切断するいくらかの二本鎖エキソヌクレアー
ゼ活性を示す
別の好ましい態様では、本発明は、エキソヌクレアーゼ仲介再集合用の核酸ビルディングブロックが、同一でない核酸鎖にハイブリダイズする際にヘテロ複合体を形成する核酸鎖を含むことを提供する。こうした複合体において、他の1つ以上の鎖にアニーリングする鎖は多結合鎖と称され、他の1つだけの鎖にアニーリングする鎖は単一結合鎖と称される。従って、常にというわけではないが通常は、単一結合鎖の長さは多結合鎖よりも短い。限定的でない例では、単一結合鎖と多結合鎖は共に、合成、断片化(物理的若しくは酵素による)、単離(Dpn Iでの選択処理等による)および/または変性のいずれかによる鋳型先祖分子から生成することができる。
【0268】
2. 11 .2.3.非確率論的連結再集合
ある形態では、本発明は、合成連結再集合(SLR)と呼ばれる非確率論的方法を提供する。これは、核酸ビルディングブロックをランダムにシャッフリングまたは鎖状体化もしくはキメラ化するのではなく、非確率論的に集合させることを除けば、確率論的シャッフリングに幾分近い。
【0269】
特にはっきりとした違いは、このSLR法が、シャッフリングしようとするポリヌクレオチド間に高いレベルの相同性があるかどうかに左右されないことである。対照的に、従来の方法、特に、従来の確率論的シャッフリング方法は、シャッフリングしようとするポリヌクレオチド間、特に、連結部位に、高いレベルの相同性を必要とした。従って、これら従来の方法は、元の前駆分子の再生成に有利であり、また、多数の新しい子孫キメラ、特に、完全長さの子孫の生成には次善の手段であった。これに対し、本発明を用いて、10100を超える異なるキメラから成る子孫分子のライブラリー(またはセット)を非確率論的に生成することができる。また、SLRを用いて、10100以上の異なる子孫キメラ(知る限り、上限はない)から成るライブラリーを生成することもできると考えられる。
【0270】
従って、ある態様では、本発明は、設計により選択される全体集合順序を有する最終的キメラ核酸分子のセットを生成する非確率論的方法であって、有用で、互いに適合する連結可能な末端を有する複数の特異的核酸ビルディングブロックを設計により生成するステップと、設計した全体集合順序が達成されるように、上記核酸ビルディングブロックを集合させるステップから成る方法を提供する。
【0271】
集合させようとする核酸ビルディングブロックの互いに適合する連結可能な末端は、これら末端が、該ビルディングブロックを予め決められた順序で結合させることができれば、このタイプの定序集合に「有用である」とみなす。従って、一形態では、核酸ビルディングブロックを結合できる全体構成順序は、連結可能な末端の設計によって定められる。1つ以上の集合ステップを用いる場合には、核酸ビルディングブロックを結合する全体集合順序も、集合ステップの逐次順序によって定められる。図4、パネルCは、5つの核酸ビルディングブロックについて、設計された(非確率論的)全体集合順序を達成するための2つの連続したステップから成る集合方法を例示する。本発明の好ましい態様では、アニーリングした構成要素を、リガーゼ(例えば、T4DNAリガーゼ)で処理し、構成要素の共有結合を達成する。
【0272】
好ましい実施形態では、最終的キメラ核酸分子の子孫セットを生成するための基礎として働く前駆核酸鋳型セットの配列を分析することにより、核酸ビルディングブロックの設計が得られる。これらの前駆核酸鋳型は、突然変異誘発を起こそうとする、すなわち、キメラ化もしくはシャッフリングしようとする核酸ビルディングブロックの設計に役立つ配列情報源としての役割を果たす。
【0273】
ある態様では、本発明は、近縁の遺伝子ファミリーと、これら近縁産物のコードされたファミリーのキメラ化に関する。具体的には、コードされた産物とは酵素である。本発明の態様に従い、突然変異誘発を起こすことのできる酵素グループの代表例として、下記の酵素およびそれらの機能を挙げることができる。
【0274】
1 リパーゼ/エステラーゼ
a.エステル(脂質)/チオエステルの対掌選択的加水分解
1) ラセミ混合物の分割
2) メソジエステル由来の光学活性酸またはアルコールの合成
b.選択的合成
1) 炭水化物エステルの位置特異的加水分解
2) 環状第2級アルコールの選択的加水分解
c.光学活性エステル、ラクトン、酸、アルコールの合成
1) 活性化/非活性化エステルのエステル交換反応
2) インターエステリフィケーション
3) ヒドロキシエステル由来の光学活性ラクトン
4) 無水物の位置および対掌選択的開環
d.デタージェント
e.脂肪/油変換
f.チーズの熟成
2 プロテアーゼ
a.エステル/アミド合成
b.ペプチド合成
c.アミノ酸エステルのラセミ混合物の分割
d.非天然アミノ酸の合成
e.デタージェント/タンパク質加水分解
3 グリコシダーゼ/グリコシルトランスフェラーゼ
a.糖/ポリマー合成
b.モノ、ジ−およびオリゴサッカリドを生成するためのグリコシド結合の切断
c.複合オリゴサッカリドの合成
d.UDP−ガラクトシルトランスフェラーゼを用いたグリコシド合成
e.ジサッカリド、グリコシルフロリド、アリールガラクトシドのグリコシル転移
f.オリゴサッカリド合成におけるグリコシル転移
g.βグルコシルスルフォキシドのジアステレオ選択性切断
h.非対称グリコシル化
i.食品加工
j.紙加工
4 ホスファターゼ/キナーゼ
a.リン酸エステルの合成/加水分解
1) 位置−、対掌選択的リン酸化
2) リン酸エステルの導入
3) ホスホリピッド前駆体の合成
4) 制御されたポリヌクレオチド合成
b.生物学的分子の活性化
c.保護基を用いない選択性リン酸結合の形成
5 モノ/ジオキシゲナーゼ
a.活性化していない有機基質の直接オキシ官能化
b.アルカン、芳香族、ステロイドのヒドロキシル化
c.アルケンのエポキシド化
d.対掌選択的スルホキシド化
e.位置−および立体選択性Bayer−Villiger酸化
6 ハロペロキシダーゼ
a.求核部位へのハロゲン化物イオンの酸化的付加
b.オレフィン結合への次亜ハロゲン酸の付加
c.シクロプロパンの環切断
d.オルトおよびパラ誘導体に変換された活性化芳香族基質
e.2−ハロ−誘導体に変換された1,3ジケトン
f.基質を含む硫黄および窒素の異種原子酸化
g.エノールアセテート、アルキンおよび活性化芳香族環の酸化
7 リグニンペロキシダーゼ/ジアリールプロパンペルオキシダーゼ
a.C−C結合の酸化的切断
b.ベンジル性アルコールのアルデヒドへの酸化
c.ベンジル炭素のヒドロキシル化
d.フェノール二量化
e.二重結合のヒドロキシル化によるジオールの生成
f.リグニンアルデヒドの切断
8 エポキシドヒドロラーゼ
a.対掌的に純粋な生物学的活性化合物
b.エポキシドの位置−および対掌選択的加水分解
c.モノオキシジナーゼによる芳香族およびオレフィンエポキシド化によるエポキシドの生成
d.ラセミエポキシドの分割
e.ステロイドエポキシドの加水分解
9 ニトリルヒドラターゼ/ニトリラーゼ
a.脂肪族ニトリルの加水分解によるカルボキシアミドの生成
b.芳香族、複素環式、不飽和脂肪族ニトリルの加水分解による対応する酸の生成
c.アクリロニトリルの加水分解
d.芳香族およびカルボキシアミド、カルボン酸(ニコチンアミド、ピコリンアミド、イソニコチンアミド)の生成
e.アクリルジニトリルの位置選択性加水分解
f.α−ヒドロキシニトリルからのα−アミノ酸
10 トランスアミナーゼ
a.アミノ基のオキソ酸への転移
11 アミダーゼ/アシラーゼ
a.アミド、アミジン、およびその他のC−N結合の加水分解
b.非天然アミノ酸分割および合成
これらの例示事項は、本発明のある特定の特徴を示すが、制限を意味するのでも、また、開示した本発明の範囲を限定するのでもない。
【0275】
従って、本発明の一形態によれば、複数の前駆核酸鋳型の配列を整列させて、1つ以上の境界点(demarcatim points)を選択する。この境界点は、相同性領域に位置していてもよく、1つ以上のヌクレオチドから成り、さらに、上記前駆鋳型の少なくとも2つによって共有される。境界点を用いて、生成しようとする核酸ビルディングブロックの限界を画定することができる。このように、前駆分子中で同定し、選択した境界点は、子孫分子の集合における見込みキメラ形成点として役立つ。
【0276】
好ましくは、有用な境界点は、少なくとも2つの前駆鋳型が共有する相同性領域(少なくとも、一つの相同ヌクレオチド塩基から成る)である。さらに好ましくは、有用な境界点は、前駆鋳型の少なくとも半分が共有する相同性領域である。またさらに好ましくは、有用な境界点は、前駆鋳型の少なくとも三分の二が共有する相同性領域である。さらに好ましくは、有用な境界点は、前駆鋳型の少なくとも四分の三が共有する相同性領域である。さらに好ましくは、有用な境界点は、前駆鋳型のほぼすべてが共有する相同性領域である。さらに好ましくは、有用な境界点は、前駆鋳型のすべてが共有する相同性領域である。
【0277】
核酸ビルディングブロックの設計、ならびに、集合させようとする核酸ビルディングブロックの互いに適合する連結可能な末端を、図6および7に示す。図示したように、前駆鋳型のセットを一列に並べることによって、自然に発生した複数の境界点が明らかになり、これら鋳型が共有する境界点の同定は、生成して、子孫キメラ分子の生成に使用されるビルディングブロックを非確率論的に決定するのに役立つ。
【0278】
好ましい実施形態では、本発明は、完全ライブラリーを作製するために、連結再集合方法を徹底して実施することを特徴とする。言い換えれば、考えられるあらゆる順序の組合せの核酸ビルディングブロックを、最終的キメラ核酸分子のセットとして呈示する。同時に、特に好ましい実施形態では、各組合せにおける集合順序(すなわち、各最終的キメラ核酸の5’→3’配列における各ビルディングブロックの集合順序)は、設計によるもの(もしくは、非確率論的)である。本発明の非確率論的性質によって、不要な副産物の可能性が大幅に減少する。
【0279】
別の好ましい実施形態では、本発明は、連結再集合方法を体系的に実施し、例えば、体系的にコンパートメント化したライブラリーを形成し、コンパートメントが、例えば1つずつ、体系的に選別できることを特徴とする。言い換えれば、本発明は、特定核酸ビルディングブロックの選択的かつ賢明な使用と、順次段階を追った集合反応の選択的かつ賢明な使用とを組み合せることにより、子孫産物の特定セットが、複数の反応容器の各々に生成される実験的設計を達成することができる。これによって、体系的検定およびスクリーニング手順を実施することが可能になる。従って、これにより、恐らく非常に多くの子孫分子を、これまでより小さなグループで体系的に検定することができる。
【0280】
特に、前駆分子間の相同性が低い場合に、極めて柔軟で、しかも徹底的かつ体系的な方法で、キメラ化を実施する能力があることから、上記発明は、多数の子孫分子から成るライブラリー(またはセット)の生成に関する。上記連結再集合の発明の非確率論的性質によって、生成される子孫分子は、設計により選択された全体集合順序を有する最終的キメラ核酸分子のライブラリーから成るのが好ましい。この発明の特に好ましい実施形態では、生成されたライブラリーは、好ましくは、10以上の異なる子孫分子種、さらに好ましくは、10以上の異なる子孫分子種、またさらに好ましくは、1010以上の異なる子孫分子種、さらに好ましくは、1015以上の異なる子孫分子種、さらに好ましくは、1020以上の異なる子孫分子種、さらに好ましくは、1030以上の異なる子孫分子種、さらに好ましくは、1040以上の異なる子孫分子種、さらに好ましくは、1050以上の異なる子孫分子種、さらに好ましくは、1060以上の異なる子孫分子種、さらに好ましくは、1070以上の異なる子孫分子種、さらに好ましくは、1080以上の異なる子孫分子種、さらに好ましくは、10100以上の異なる子孫分子種、さらに好ましくは、10110以上の異なる子孫分子種、さらに好ましくは、10120以上の異なる子孫分子種、さらに好ましくは、10130以上の異なる子孫分子種、さらに好ましくは、10140以上の異なる子孫分子種、さらに好ましくは、10150以上の異なる子孫分子種、さらに好ましくは、10175以上の異なる子孫分子種、さらに好ましくは、10200以上の異なる子孫分子種、さらに好ましくは、10300以上の異なる子孫分子種、さらに好ましくは、10400以上の異なる子孫分子種、さらに好ましくは、10500以上の異なる子孫分子種、さらに好ましくは、101000以上の異なる子孫分子種から成る。
【0281】
一形態によれば、前述のように生成した最終的キメラ核酸分子のセットは、ポリペプチドをコードするポリヌクレオチドから成る。1つの好ましい実施形態によれば、このポリヌクレオチドは遺伝子であり、合成遺伝子でもよい。別の好ましい実施形態では、このポリヌクレオチドは遺伝子経路であり、合成遺伝子経路でもよい。この発明は、本発明により生成された1つ以上の合成遺伝子を、真核生物(植物を含む)内で操作可能な経路等の合成遺伝子経路に組み込むことを特徴とする。
【0282】
境界点の選択、核酸ビルディングブロックのサイズと数、ならびに結合のサイズと設計に関して、選択および制御に大きな自由があるため、本発明の能力は極めて優れていることに留意されたい。さらに、本発明の操作性のために、分子間相同性の要件が非常に緩和されることにも留意すべきである。実際、分子間相同性がほとんどもしくは全くない領域でも、境界点を選択することもできる。例えば、コドンのゆらぎ、すなわち、コドンの縮重のために、対応する前駆鋳型に元々コードされていたアミノ酸を変化させることなく、ヌクレオチド置換を核酸ビルディングブロックに導入することができる。あるいは、元のアミノ酸のコーディングが変化するように、コドンを変化させることも可能である。この発明は、このような置換を核酸ビルディングブロックに導入して、分子間で相同性の境界点の発生率を高め、従って、ビルディングブロック間で達成される結合の数を増加することにより、今度は、生成しようとする子孫キメラ分子の数を増やすことを特徴とする。
【0283】
別の態様では、ビルディングブロックを生成するステップの合成の種類によって、ヌクレオチド(例えば、コドンまたはイントロンもしくは調節配列等の、1つ以上のヌクレオチド)の設計および導入が可能になる。尚、これらヌクレオチドは、in vitro法(例えば、突然変異誘発により)やin vivo法(例えば、宿主生物の遺伝子スプライシング能力を利用して)で、後に任意で除去することができる。多数の態様において、有用な境界点を形成するという利点が見込まれる以外に、多くの理由から、これらヌクレオチドの導入が好ましいことに留意すべきである。
【0284】
従って、別の実施形態によれば、本発明は、核酸ビルディングブロックを用いて、イントロンを導入することを特徴とする。従って、本発明は、機能性イントロンを本発明の合成遺伝子に導入することを特徴とする。本発明はまた、機能性イントロンを本発明の合成遺伝子経路に導入することを特徴とする。従って、本発明は、1つ(以上)の人工的に導入したイントロンを含む合成遺伝子であるキメラポリヌクレオチドの生成に関する。
【0285】
従って、本発明はまた、1つ(以上)の人工的に導入したイントロンを含む合成遺伝子経路であるキメラポリヌクレオチドの生成に関する。好ましくは、人工的に導入したイントロンは、天然イントロンが、遺伝子スプライシングで機能的に働くのと同様に、遺伝子スプライシングについて、1つ以上の宿主細胞内で機能的である。本発明は、組換えおよび/またはスプライシングのために、宿主生物に導入しようとする合成イントロン含有ポリヌクレオチドの生成方法を提供する。
【0286】
前駆体分子間に相同性がほとんどまたは全くない領域で、本明細書に記載したカップリングを用いて、キメラ化を達成する能力は、新しい遺伝子経路の集合に有用で、しかも、実際には不可欠である。本発明は、従って、合成連結再集合を用いた新しい合成遺伝子経路の生成に関する。ある形態では、これは、目的とする宿主内で操作可能な調節配列(プロモーター等)の導入により達成され、該配列が目的とする宿主に導入されると、新しい遺伝子経路に操作性が付与される。ある態様では、本発明は、複数の目的とする宿主(例えば、微生物や植物細胞)内で操作可能な新規の合成遺伝子経路の生成に関する。これは、例えば、第1目的宿主内で操作可能な調節配列と、第2目的宿主内で操作可能な調節配列から成る複数の調節配列の導入により、達成することができる。同様の方法を実施して、第3の目的宿主種等において、遺伝子経路の操作性を達成することができる。目的とする宿主種の数は、それぞれ、1〜10の間の整数、もしくは10以上の整数でもよい。あるいはまた、例えば、複数の目的宿主における遺伝子経路の操作性は、複数の目的宿主内に固有操作性を有する調節配列の導入により、達成することができる。
【0287】
従って、ある実施形態によれば、本発明は、核酸ビルディングブロックを用いて、調節配列、特に、遺伝子発現のための調節配列を導入することを特徴とする。好ましい調節配列には、限定しないが、合成のもの、ならびに、古細菌、細菌、真核(ミトコンドリアを含む)、ウイルス、およびプリオンまたはプリオン様生物に存在するものが含まれる。好ましい調節配列としては、限定しないが、プロモーター、オペレーター、ならびに活性化因子結合部位が挙げられる。従って、本発明は、機能的調節配列を本発明の合成遺伝子に導入することを特徴とする。本発明はまた、機能的調節配列を本発明の合成遺伝子経路に導入することを特徴とする。
【0288】
このように、本発明は、1つ(以上)の人工的に導入した調節配列を含む合成遺伝子であるキメラポリヌクレオチドの生成に関する。従って、本発明はまた、1つ(以上)の人工的に導入した調節配列を含む合成遺伝子経路であるキメラポリヌクレオチドの生成に関する。好ましくは、人工的に導入した調節配列は、合成ポリヌクレオチドの一つ以上の遺伝子に機能しうるように結合され、1つ以上の宿主細胞内で機能的である。
【0289】
本発明に有用な好ましい細菌プロモーターとしては、lacI、lacZ、T3、T7、gpt、ラムダR、Pおよびtrpが挙げられる。有用な真核プロモーターには、CMV即時型初期、HSVチミジンキナーゼ、初期および後期SV40、レトロウイルス由来のLTR、ならびにマウスメタロチネイン−Iがある。具体的な植物調節配列として、植物またはその一部の使用に応じて、構成的にあるいは段階および/または組織特異的のうちいずれかで、植物における転写指令に活性なプロモーターが挙げられる。これらのプロモーターには、限定しないが、カリフラワーモザイクウイルス(CaMV)(Guilleyら、1982)等の35Sプロモーター;リブロースビスリン酸カルボキシラーゼ小サブユニット遺伝子(Coruzziら、1984)のプロモーター等の、葉特異的発現のためのプロモーター;グルタミンシンターゼ遺伝子(Tingeyら、1987)由来のプロモーター等、根特異的発現のためのプロモーター;Brassica napus由来のアブラナ科Aプロモーター(Ryanら、1989)等の、種子特異的発現のためのプロモーター;ジャガイモ由来のクラスIパタチンプロモーター(Rocha−Sasaら、1989;Wenzlerら、1989)等の、塊茎特異的発現のためのプロモーター、あるいは、トマト由来のポリガラクツロナーゼ(PG)プロモーター(Birdら、1988)等の、果実特異的発現のためのプロモーターが挙げられる。
【0290】
本発明に好ましいその他の調節配列には、ターミネーター配列およびポリアデニル化シグナル、ならびに、植物で機能するあらゆる配列があるが、その選択は、当業者が問題なく行うことができる。このような配列の一例は、Agrobacterium tumefaciensのノパリンシンターゼ(nos)遺伝子の3’フランキング領域である。また、調節配列には、CaMVの35Sプロモーターに存在するようなエンハンサー配列、ならびに、アルファルファモザイクウイルス(AlMV)RNA4のリーダー配列(Brederodeら、1980)等のmRNA安定化配列、あるいは、同様に機能するその他の配列も含まれる。
【0291】
本発明を用いて生成される合成遺伝子は、別の核酸との組換えのための基質としても使用することができる。同様に、本発明を用いて生成される合成遺伝子経路は、別の核酸との組換えのための基質としても使用することができる。好ましい例では、組換えは、合成イントロン含有遺伝子と、組換え相手として働く核酸との間の相同性領域により促進される、あるいは、該領域で起こる。特に好ましい例では、組換え相手は、合成遺伝子または合成遺伝子経路等、本発明により生成した核酸でもよい。組換えは、合成遺伝子に人工的に導入した1つ(以上)のイントロンに存在する相同性領域により促進される、あるいは、該領域で起こる。
【0292】
本発明の合成連結再集合方法は、複数の核酸ビルディングブロックを利用するが、これらブロックの各々は、二つの連結可能な末端を有するのが好ましい。各核酸ビルディングブロックの二つの連結可能な末端は、二つの平滑末端(すなわち、各々がゼロヌクレオチドのオーバーハングを有する)、もしくは、好ましくは、一つの平滑末端と一つのオーバーハング、あるいは、さらに好ましくは、やはり二つのオーバーハングである。
【0293】
この目的のための有用なオーバーハングは、3’オーバーハングまたは5’オーバーハングである。したがって、核酸ビルディングブロックは、3’オーバーハングまたは5’オーバーハング、あるいは、二つの3’オーバーハングまたは二つの5’オーバーハングである。核酸ビルディングブロックを集合させて、最終的キメラ核酸分子を形成する全体順序は、意図的な実験設計により決定するものとし、ランダムではない。
【0294】
ある好ましい実施形態によれば、二つの一本鎖核酸(一本鎖オリゴとも呼ぶ)を化学合成し、これらを接触させて、アニーリングし、二本鎖核酸ビルディングブロックを形成することにより、核酸ビルディングブロックを生成する。
【0295】
二本鎖核酸ビルディングブロックは、様々なサイズでよい。これらビルディングブロックのサイズは、実験者の選択によって、変えることができる。ビルディングブロックの好ましいサイズは、1塩基対(オーバーハングを含まない)〜100,000塩基対(オーバーハングを含まない)の範囲である。これ以外にも、下限が1bp〜10,000bp(この範囲にあるすべての整数値を含む)、上限が2bp〜100,000bp(この範囲にあるすべての整数値を含む)とするサイズの範囲も提供される。
【0296】
ポリメラーゼに基づくこれらの増幅法を用いて、数万個の塩基対でなければ、高い忠実度で、長さが最大数千個までの塩基対の二本鎖核酸を生成できることに留意されたい。化学合成(例えば、ホスホロアミダイドに基づく)を用いて、高い忠実度で、長さが最大数百ヌクレオチドまでの核酸を生成することができる。しかし、所望であれば、これらを、例えば、オーバーハングまたは付着末端を用いて、構成し、数万個の塩基対でなければ、長さが最大数千個の塩基対の二本鎖核酸を形成することができる。
【0297】
また、本発明に従い、各方法を組み合わせて(例えば、ホスホロアミダイトに基づく化学合成とPCR)使用することも可能である。従って、様々な方法により作製した核酸ビルディングブロックを組み合わせて用いて、本発明の子孫分子を生成することもできる。
【0298】
核酸ビルディングブロックを生成する化学合成の使用は、本発明で特に好ましく、同時に、工程上の安全および容易さ等の他の理由からも有利である。生体サンプルのクローニングまたは採取もしくは実際の取り扱いは一切必要ない。核酸ビルディングブロックの設計は、紙の上で実施することができる。従って、この発明は、組換え技術における工程の安全面で利点を有することがわかる。
【0299】
しかし、ある好ましい実施形態によれば、本発明に従う二本鎖核酸ビルディングブロックは、ポリヌクレオチド鋳型のポリメラーゼに基づく増幅により生成することもできる。図2に示す非制限的実施例では、プライマーの第1セット、FおよびRを用いた第1ポリメラーゼ増幅反応を実施し、産物Aとほぼ同じである平滑末端産物(標識化反応1、産物1)を生成する。プライマーの第2セット、FおよびRを用いて第2ポリメラーゼ増幅反応を実施し、産物Bとほぼ同じである平滑末端産物(標識化反応2、産物2)を生成する。これら二つの産物を混合し、融解およびアニーリングさせて、二つのオーバーハングを持ち、有用であることが見込まれる二本鎖核酸ビルディングブロックを生成する。図2の例では、エキソヌクレアーゼIII等の3’作用性エキソヌクレアーゼを用いた他の三つの産物のヌクレアーゼベースの分解により、3’オーバーハングを持つ産物(産物C)が選択される。また、5’作用性エキソヌクレアーゼ(例えば、レッドアルファ)を用いて、例えば、代わりに産物Dを選択できることに留意されたい。さらに、ハイブリダイゼーションに基づく手段等、上記以外の選択手段を用いてもよいし、これらの手段に、磁気ビーズ手段等の別の手段を組み込み、所望の産物の分離を促進することもできる。
【0300】
上記以外にも、本発明に有用な二本鎖核酸ビルディングブロックを生成する方法は多数存在する。これらは、当業者には公知であり、また、容易に実施することができる。
【0301】
特に好ましい実施形態によれば、本発明に有用な二本鎖核酸ビルディングブロックは、まず、二つの一本鎖核酸を生成し、次に、これらをアニーリングして、二本鎖核酸ビルディングブロックを形成する。二本鎖核酸ビルディングブロックの二本の鎖は、オーバーハングを形成するものを除いて、ヌクレオチド毎に相補的であり、従って、オーバーハングを除いて、ミスマッチを一切含まない。別の実施形態によれば、二本鎖核酸ビルディングブロックの二本の鎖は、オーバーハングを形成するものを除いて、ヌクレオチド毎よりも少ない割合で相補的である。従って、この態様によれば、二本鎖核酸ビルディングブロックを用いて、コドン縮重を導入する。好ましくは、コドン縮重は、本書に記載した部位飽和突然変異誘発を用いて、一つ以上のN,N,G/Tカセットを用いて、あるいは、一つ以上のN,N,Nカセットを用いて導入する。
【0302】
本発明に従う順序立った集合を達成するための実験設計の例として、下記のものが挙げられる:
1)特異的核酸ビルディングブロックの設計、
2)各核酸ビルディングブロックの特異的連結末端の設計、
3)核酸ビルディングブロックの構成の特定順序の設計。
【0303】
オーバーハングは、3’オーバーハングまたは5’オーバーハングでよい。オーバーハングはまた、末端リン酸基を有してもよいし、あるいは、末端リン酸基がなくてもよい(代わりに、例えば、ヒドロキシル基を有する)。オーバーハングは、何個のヌクレオチドから成るものでもよい。好ましくは、オーバーハングは、0個のヌクレオチド(平滑末端のように)〜10,000個のヌクレオチドから成る。従って、オーバーハングのサイズは、広い範囲で使用可能である。従って、下限は、1〜200までの整数、また上限は2〜10,000までの整数でよい。ある特定の例によれば、オーバーハングは、1ヌクレオチド〜200ヌクレオチドのうちのいずれからでも構成することができる(該範囲内の整数すべてを含む)。
【0304】
最終的な(final)キメラ核酸は、指定したビルディングブロックすべてが集合するまで、2つ以上のビルディングブロックを順次集合させることにより、生成することができる。二つの集合ステップの実施の間に、実施サンプルを、サイズ選択または精製工程、もしくはその他の選択または富化工程に任意で付してもよい。あるいは、一ステップで一度に全指定ビルディングブロックを集合させることにより、最終的キメラ核酸分子を生成することもできる。
【0305】
In vitro シャッフリング
いくつかの標準的遺伝子接合と同様のことをin vitroシャッフリングにより実施することもできる。例えば、「分子戻し交雑」は、ハイブリッドの核酸を野生型核酸と繰り返し混合すると同時に、関心のある突然変異を選択することにより、実施することができる。伝統的な育種と同様、この手法を用いて、様々な供給源由来の表現型を組み合わせて、好適なバックグラウンドとすることができる。
【0306】
これは、例えば、選択していない特徴(すなわち、免疫原性)に作用する中立突然変異の除去に有用である。従って、上記の手法は、タンパク質におけるどの突然変異が、増加した生物学的活性に関与し、どれが関与しないのかを決定する上で有用であり、これは、誤りがちな突然変異誘発もしくはカセット突然変異誘発法により達成されなかった利点である。
【0307】
大きな機能遺伝子は、小さなランダムポリヌクレオチドの混合物から正確に集合させることができる。この反応は、化石の高度に断片化したDNA由来の遺伝子の再集合に有用である。さらに、化石から採取したランダム核酸断片を、近縁種由来の類似した遺伝子からのポリヌクレオチドと組み合わせてもよい。
【0308】
また、本発明の方法は、各種研究や診断分野でのニーズに応じて、単一細胞由来の全ゲノムのin vitro増幅に使用することができると考えられる。PCRによるDNA増幅は、実際には、長さ約40kbまでに制限される。PCRによる大腸菌(5,000kb)のような全ゲノムの増幅には、125本の40kbポリヌクレオチドを生成する約250個のプライマーを必要とすることになる。この手法は、十分な配列データが入手できないことから、実用的ではない。これに対し、有性PCRサイクルを用いたゲノムのポリヌクレオチドのランダム産生と、これに続く小さなポリヌクレオチドのゲル精製は、可能性がある多数のプライマーをもたらすであろう。ランダムな小ポリヌクレオチドの混合物をPCR反応のプライマーとして、単独で、あるいは、鋳型としての全ゲノムと共に使用することにより、該ゲノムの多数のコピーを含む単一鎖状体を理論上の終点とする、逆連鎖反応が確実に起こる。
【0309】
ランダムポリヌクレオチドのみを用いた場合には、コピー数の100倍増幅と、50kbより大きい平均ポリヌクレオチドのサイズを実現することができる。多数の小さいポリヌクレオチドのオーバーラップによって、さらに大きい鎖状体が生成されると考えられる。合成プライマーを用いて得られた特定のPCR産物の品質は、増幅していないDNAから得た産物と見分けがつかないであろう。この手法は、ゲノムのマッピングに有用であると予想される。
【0310】
シャッフリングしようとするポリヌクレオチドは、実験者の判断で、ランダムまたは非ランダムポリヌクレオチドとして生成することができる。
【0311】
In vivo シャッフリング
in vivoシャッフリングの実施形態では、少なくとも二つの異なる核酸配列が、各宿主細胞に存在する条件下で、細菌または真核細胞中に特定核酸配列の混合集団を導入する。ポリヌクレオチドは、様々な方法で、宿主細胞中に導入することができる。宿主細胞は、当業者には公知の方法、例えば、塩化カルシウムによる処理を用いて、小さいポリヌクレオチドで形質転換することができる。ポリヌクレオチドをファージゲノムに挿入する場合には、特定核酸配列を有する組換え体ファージゲノムで、宿主細胞をトランスフェクションすることができる。あるいは、電気穿孔、トランスフェクション、リポフェクション、バイオリスティックス(biolistics)、接合等の手段を用いて、核酸配列を導入することも可能である。
【0312】
一般に、この実施形態では、特定核酸配列は、宿主細胞内で該配列を安定して複製することのできるベクター中に存在する。さらに、ベクターは、ベクターを有する宿主細胞が選択されるように、マーカー遺伝子をコードすると考えられる。これによって、宿主細胞への導入の後、突然変異した特定核酸配列の回収が確実に達成される。しかし、特定核酸配列の混合集団全体が、ベクター配列上に存在する必要はないと考えられる。むしろ、宿主細胞へのポリヌクレオチドの導入後に、各宿主細胞が、そこに存在する少なくとも1つの特定核酸配列を有する一つのベクターを確実に含むようにするために、十分な数の配列をベクターにクローニングする必要がある。また、特定核酸配列の集団のサブセットをベクターにクローニングするのではなく、このサブセットを宿主細胞に安定した状態で組み込んでもよい。
【0313】
同一性領域を有する二つのポリヌクレオチドを宿主細胞に挿入すると、両ポリヌクレオチド間に相同的組換えが起こることがわかっている。二つの突然変異した特定核酸配列間で起こるこのような組換えの結果、状況に応じて、二重または三重ハイブリッドが生成される。
【0314】
また、突然変異を起こした特定核酸配列のいくつかが、直鎖状核酸分子上に存在する場合には、組換えの頻度が高くなることも認められている。従って、好ましい実施形態では、特定核酸配列のいくつかが、直鎖状ポリヌクレオチド上に存在する。
【0315】
形質転換の後、宿主細胞形質転換体を選択に付し、所望の品質を有する突然変異した特定核酸を含む宿主細胞形質転換体を同定する。例えば、特定の薬剤に対して、高い耐性を望む場合には、形質転換した宿主細胞を、高濃度の該当する薬剤にさらし、高い薬剤耐性を賦与できる突然変異タンパク質を産生する形質転換体を選択する。特定タンパク質の受容体に結合する高い能力を望む場合には、該タンパク質の発現を形質転換体から誘発し、こうして得られたタンパク質を、当業者には公知の方法によりリガンド結合アッセイで検定して、リガンドへの高い結合を示す突然変異集団のサブセットを同定する。あるいは、タンパク質を別の系で発現させて、適切なプロセシングを確実にすることもできる。
【0316】
所望の特徴を有する第1の組換え特定核酸配列(娘配列)のサブセットを同定した後、第2ラウンドの組換えに付す。
【0317】
第2サイクルの組換えでは、組換え特定核酸配列を、元の突然変異特定核酸配列(親配列)と混合し、サイクルを前述と同様に繰り返す。この方法では、性質が増強された、あるいは、性質が増強されたタンパク質をコードする第2の組換え特定核酸配列のセットを同定することができる。このサイクルは、所望する回数だけ繰り返すことができる。
【0318】
また、第2またはそれに続く組換えサイクルにおいて、戻し交雑を実施することも考えられる。分子戻し交雑は、少なくとも1つの野生型核酸配列と、突然変異を起こした核酸配列が、形質転換後に同じ宿主細胞内に存在するように、所望の特定核酸配列を、多数の野生型配列と混合することにより、実施することができる。野生型の特定核酸配列を用いた組換えは、免疫原性のような選択していない特徴には作用するが、選択した特徴には作用しない中立突然変異を排除する。
【0319】
本発明の別の実施形態では、第1ラウンドの間に、特定核酸配列のサブセットを、宿主細胞への導入の前に、PCR増幅を減速または停止することにより、小さいポリヌクレオチドとして生成することができる。ポリヌクレオチドのサイズは、他の配列と相同的に組換えできるように、他の配列との同一性領域をいくつか含有するのに十分大きいものでなければならない。ポリヌクレオチドのサイズは、0.03kb〜100kb、さらに好ましくは0.2kb〜10kbの範囲である。また、後続のラウンドでは、前のラウンドから選択した配列を除くすべての特定核酸配列を使用して、宿主細胞への導入前に、PCRポリヌクレオチドを生成することも考えられる。
【0320】
短いポリヌクレオチド配列は、一本鎖または二本鎖のいずれでもよい。元々一本鎖だった配列が、二本鎖になった場合には、宿主細胞への挿入の前に、熱、化学薬品、もしくは酵素を用いて、変性することができる。核酸鎖を分離するのに適した反応条件は、当業者には公知である。
【0321】
この方法のステップは無限に繰り返すことができるが、達成できるハイブリッドの数だけには制限される。サイクルを所定回数繰り返した後、見込まれるすべてのハイブリッドが達成されると、それ以上のサイクルは余剰である。
【0322】
ある実施形態では、突然変異を起こした同じ鋳型核酸を繰り返し組換えて、得られた組換え体を所望の特徴について選択する。
【0323】
従って、突然変異鋳型核酸の初期プールまたは集団は、大腸菌等の細菌内で複製することのできるベクターにクローニングされる。ベクターは、大腸菌内で自律複製が可能であれば、特に限定しない。好ましい実施形態では、ベクターは、該ベクターに結合された、突然変異を起こした特定核酸によりコードされるタンパク質の発現および産生を可能にするよう設計される。また、ベクターは、選択マーカーをコードする遺伝子を含むことが好ましい。
【0324】
突然変異を起こした核酸配列のプールを含むベクターの集団を、大腸菌宿主細胞中に導入する。ベクター核酸配列は、形質転換、トランスフェクション、または、ファージの場合には感染により、導入することができる。細菌を形質転換するのに使用するベクターの濃度は、多数のベクターが各細胞に導入されるような濃度とする。いったん細胞内に存在すると、相同的組換え効率は、各種ベクター間に相同的組換えが起こるようなものとする。これによって、突然変異を起こした元の親配列とは異なる突然変異の組合せを有するハイブリッド(娘)が生成される。
【0325】
次に、宿主細胞をクローン的に複製し、ベクターに存在するマーカー遺伝子について選択する。この選択のもとでは、プラスミドを有する細胞だけが増殖することになる。
【0326】
次に、ベクターを含む宿主細胞を、好ましい突然変異の存在について試験する。例えば、選択しようとする遺伝子が、薬剤耐性が向上した遺伝子である場合には、このような試験は、細胞を選択的圧力下に置くことから成る。ベクターが、突然変異を起こした核酸配列によりコードされたタンパク質の発現を可能にする場合には、このような選択は、こうしてコードされたタンパク質の発現、該タンパク質の単離、ならびに、該タンパク質が、関心のあるリガンドに高い効率で結合するかどうかを決定するための試験等を含む。
【0327】
所望の特徴を賦与する、突然変異を起こした特定の娘核酸配列を同定した後、すでにベクターに結合した、あるいは該ベクターから分離した上記核酸を単離する。次に、この核酸を核酸の第1または親集団と混合した後、サイクルを繰り返す。
【0328】
この方法により、所望の性質が増強された核酸配列を選択できることが明らかになっている。
【0329】
別の実施形態では、ハイブリッドの第1世代を細胞内に保持し、突然変異を起こした親配列を再び該細胞に添加する。従って、実施形態Iの第1サイクルを前述同様に実施する。ただし、娘核酸配列を同定した後、これら配列を含む宿主細胞を保持する。
【0330】
突然変異を起こした親特定核酸集団は、ポリヌクレオチドとして、あるいは、同じベクターにクローンニングして、娘核酸をすでに含む宿主細胞中に導入する。細胞内で組換えが起こるようにし、次世代の組換え体、すなわち孫娘を、前述した方法により選択する。
【0331】
このサイクルは、所望の特徴を有する核酸またはペプチドが得られるまで、多数回繰り返すことができる。後続のサイクルでは、好ましいハイブリッドに添加される、突然変異を起こした配列の集団は、親ハイブリッド、または、後続するいずれの世代に由来するものでもよい。
【0332】
別の実施形態では、本発明は、得られた組換え特定核酸の「分子」戻し交雑を実施して、あらゆる中立突然変異を排除する方法を提供する。中立突然変異とは、核酸またはペプチドに所望の性質を賦与しない突然変異のことである。ところが、このような突然変異は、核酸またはペプチドに望ましくない特性を与えかねない。従って、これらの中立突然変異を排除することが好ましい。本発明の方法は、それを実施する手段を提供する。
【0333】
この実施形態では、所望の特徴を有するハイブリッド核酸をこの実施形態の方法により取得した後、核酸、核酸を有するベクター、または、ベクターおよび核酸を含む宿主細胞を単離する。
【0334】
次に、核酸またはベクターを、大過剰量の野生型核酸を含む宿主細胞に導入する。ハイブリッドの核酸と、野生型配列の核酸が、組換えを起こす。得られた組換え体を、ハイブリッド核酸と同じ選択下に置く。所望の特徴を保持した組換え体だけが選択されることになる。野生型DNAとの組換えにより、所望の特徴を賦与しないサイレント突然変異は消失する。このサイクルは、サイレント突然変異がすべて排除されるまで、多数回繰り返すことができる。
【0335】
このように、本発明の方法を分子戻し交雑に用いて、不必要な突然変異またはサイレント突然変異を排除することができる。
【0336】
有用性
本発明のin vivo組換え法は、特定ポリヌクレオチドまたは配列の未知ハイブリッドまたは対立遺伝子のプールについて、ブラインド方式で実施することができる。しかし、特定ポリヌクレオチドの実際のDNAまたはRNA配列を知る必要がない。
【0337】
遺伝子の混合集団内で組換えを用いる手法は、あらゆる有用なタンパク質、例えば、インターロイキンI、抗体、tPAおよび成長ホルモンの生成に有用である。この手法は、変化させた特異性または活性を有するタンパク質の生成に用いることができる。この手法は、遺伝子のハイブリッド核酸配列、例えば、プロモーター領域、イントロン、エクソン、エンハンサー配列、31非翻訳領域または51非翻訳領域の生成にも有用である。従って、この手法は、発現の速度が高い遺伝子を生成するのに使用することができる。また、この手法は、反復DNA配列の研究にも有用である。最後に、この手法は、リボザイムまたはアプタマーを突然変異する上で有用である。
【0338】
多様性領域を分離するスカフォールド(scaffold)様領域は、特に、この発明の方法に適している。保存されたスカフォールドは、自己会合により全体フォールディングを決定すると共に、特異的結合を仲介する比較的制限されていないループを展示する。このようなスカフォールドの例として、免疫グロブリンβバレル、および4ヘリックス束がある。本発明の方法を用いて、結合のための、突然変異を起こした配列の様々な組合せを有するスカフォールド様タンパク質を生成することができる。
【0339】
本発明の方法により、同様の標準的遺伝子の接合を実施することも可能である。例えば、ハイブリッドの核酸と、野生型核酸との混合により、「分子」戻し交雑を繰り返すと共に、関心のある突然変異の選択をする。伝統的育種同様、この手法を用いて、様々な採取源由来の表現型を、選択バックグラウンドに組み込むことができる。これは、例えば、選択していない特徴(すなわち、免疫原性)に影響する中立突然変異の除去に有用である。従って、タンパク質中のどの突然変異が、増大した生物学的活性に関与し、どれが関与しないかを決定するのに有用である。
【0340】
ペプチド展示方法
本発明を用いて、前記方法のいずれか、ならびにいずれかの組合せを用いたin vitroおよび/またはin vivo組換えによって、ペプチド展示方法により選択されたポリヌクレオチド配列をシャッフルすることができる。上記ペプチド展示方法は、会合ポリヌクレオチドが、ある表現型(例えば、予め決められた受容体(リガンド)の親和性)について選別される展示ペプチドをコードすることを特徴とする。
【0341】
益々重要性が高まる生物薬剤学的薬剤開発および分子生物学の側面は、ペプチド構造の同定であり、これには、生物学的高分子と相互作用するペプチドまたは偽ペプチドの1次アミノ酸配列が含まれる。予め決められた生物学的高分子(例えば、受容体)との結合等、所望の構造または機能特性を有するペプチドを同定する一方法は、ペプチドのアミノ酸配列が付与した所望の構造または機能特性を有する個別ライブラリーのメンバーについて、大きなライブラリーまたはペプチドをスクリーニングすることを含む。
【0342】
ペプチドライブラリーを生成する指向性化学合成方法以外に、いくつかの組換えDNA方法も報告されている。そのうちの一つは、バクテリオファージ粒子または細胞の表面に、ペプチド配列、抗体、またはその他のタンパク質を展示することから成る。一般に、これらの方法では、各バクテリオファージ粒子または細胞は、天然のバクテリオファージまたは細胞タンパク質配列に加えて、単一種の展示ペプチドを展示する個別ライブラリーメンバーとしての役割を果たす。各バクテリオファージまたは細胞は、特定の展示ペプチド配列をコードするヌクレオチド配列情報を含む。従って、展示ペプチド配列は、単離したライブラリーメンバーのヌクレオチド配列決定によりみいだすことができる。
【0343】
周知のペプチド展示方法は、典型的には、バクテリオファージコートタンパク質との融合のように、繊維状バクテリオファージの表面に、ペプチド配列を展示することを含む。バクテリオファージライブラリーは、固定化した予定高分子または小分子(例えば、受容体)とインキュベートし、固定化した高分子に結合するペプチド配列を示すバクテリオファージ粒子を、予め決められた高分子に結合するペプチド配列を示さないものから、区分することができる。次に、固定化した高分子に結合したバクテリオファージ粒子(すなわち、ライブラリーメンバー)を回収し、複製して、選択されたバクテリオファージ小集団を増幅し、これを、次のラウンドの親和性富化およびファージ複製に付す。親和性富化およびファージ複製を数回繰り返した後、このようにして選択されたバクテリオファージライブラリーメンバーを単離し、展示ペプチド配列をコードするヌクレオチド配列を決定することによって、予め決めた高分子(例えば、受容体)に結合するペプチドの配列を同定する。このような方法は、PCT特許公報WO91/17271、WO91/18980、WO91/19818およびWO93/08278号にさらに詳しく記載されている。
【0344】
後者のPCT公報には、ペプチドリガンド展示のための組換えDNA方法が記載されており、この方法は、融合タンパク質のライブラリー生成から成る。該融合タンパク質は各々、予め決めた高分子への結合に利用可能な、様々な配列を含む第1ポリペプチド部分と、個々の融合タンパク質をコードするDNAベクター等のDNAに結合する第2ポリペプチド部分とから構成されている。融合タンパク質の発現を可能にする条件下で、形質変換された宿主細胞を培養すると、融合タンパク質は、それをコードするDNAベクターに結合する。この宿主細胞を溶解すると、ファージに基づく展示系でバクテリオファージ粒子を選別するのとほぼ同じように、予め決めた高分子に対して、融合タンパク質/ベクターDNA複合体を選別することができる。このようにして、選択された融合タンパク質/ベクターDNA複合体におけるDNAベクターの複製および配列決定が、選択したライブラリーペプチド配列の同定のための基準として役立つ。
【0345】
ペプチドのライブラリー、ならびに同様のポリマーを生成するその他の系は、組換え体およびin vitro化学合成方法の両方の特徴を有する。これらハイブリッド方法では、無細胞酵素機構を用いて、ライブラリーメンバー(すなわち、ペプチドまたはポリヌクレオチド)のin vitro合成を達成する。ある方法では、選択およびPCR増幅サイクルを交互に実施することにより、予定したタンパク質または予め決めた色素分子を結合する能力を有するRNA分子を選択した(TuerkおよびGold、1990;EllingtonおよびSzostak、1990)。同様の方法を用いて、予め決めたヒト転写因子を結合するDNA配列を同定した(ThiesenおよびBach、1990;BeaudryおよびJoyce、1992;PCT特許公報WO92/05258およびWO92/14843号)。同様に、in vitro翻訳技術を用いて、目的タンパク質が合成されており、この技術は、ペプチドの大きなライブラリーを形成する方法として提案されている。一般に、安定化したポリソーム複合体を含む、in vitro翻訳に基づいたこれらの方法は、PCT特許公報WO88/08453、WO90/05785、WO90/07003、WO91/02076、WO91/05058、ならびにWO92/02536号にさらに詳しく記載されている。出願人は、ライブラリーメンバーが、DNA結合活性を備えた第1ポリペプチド部分を有する融合タンパク質と、ライブラリーメンバー独特のペプチド配列を有する第2ポリペプチド部分とを含む方法を記載している。このような方法は、中でも、無細胞in vitro選択フォーマットでの使用に適している。
【0346】
展示したペプチド配列は様々な長さでよく、典型的に、3〜5,000アミノ酸長、またはそれ以上の長さで、多くの場合、5〜100アミノ酸長、さらには8〜15アミノ酸長である。ライブラリーは、様々な長さの展示ペプチド配列を有するライブラリーメンバーから構成されることができ、あるいは、一定長さの展示ペプチド配列を有するライブラリーメンバーからなるものでもよい。展示されたペプチド配列の一部または全部は、ランダム、擬似ランダム、規定セット核(kernal)、一定のもの等のいずれでもよい。この展示方法は、ポリソーム上の初期scFv、または、ファージ上に展示されるscfv等の一本鎖抗体のin vitroおよびin vivo展示方法を含むが、これらの展示方法は、非常に多様な可変領域配列および結合特異性を有するscfvライブラリーの大規模なスクリーニングを可能にする。
【0347】
本発明は、また、ランダム、擬似ランダム、ならびに規定配列フレームワークペプチドライブラリーを提供すると共に、これらのライブラリーを生成およびスクリーニングして、ペプチドまたはRNAを所望のように修飾する受容体分子または目標エピトープ、または遺伝子産物に結合する有用な化合物(例えば、一本鎖抗体を含むペプチド)を同定する方法を提供する。ランダム、擬似ランダム、ならびに規定配列フレームワークペプチドは、ペプチドライブラリーメンバーのライブラリーから生成する。該メンバーは、展示ペプチドが合成されたポリヌクレオチド鋳型に結合した展示ペプチドまたは展示一本鎖抗体を含む。結合方法は、選択した本発明の具体的態様に応じて変えてよく、ファージ粒子中の包膜や、細胞への組込み等が挙げられる。
【0348】
親和性富化方法により、ペプチドおよび一本鎖抗体の非常に大きいライブラリーをスクリーニングすることができ、所望のペプチドまたは一本鎖抗体をコードするポリヌクレオチド配列を選択することができる。次に、ポリヌクレオチドを単離、シャッフルして、選択したペプチド(または予め定めたその一部)もしくは一本鎖抗体(または、そのVHI、VLIまたはCDR部分のみ)のアミノ酸配列を複合的に組み換える。これらの方法を用いて、一分子について所望の結合親和性を有するものとして、ペプチドまたは一本鎖抗体を同定することができ、シャッフリング方法を利用して、急速に、所望の高親和性ペプチドまたはscfvに収斂することが可能である。次に、ペプチドまたは抗体を合成して、適した用途(例えば、薬剤または診察用薬剤)のための従来の手段により大量合成することができる。
【0349】
本発明の重要な利点は、目的のペプチドリガンドまたは抗体を単離するのに、予想されるリガンド構造に関する予備情報を必要としないことである。同定したペプチドは、生物学的活性を有する、すなわち、選択した受容体分子について少なくとも特異的な結合親和性を含むが、さらには、他の化合物の結合を阻止する能力、代謝経路を刺激または阻害する能力、信号またはメッセンジャーとして働く能力、細胞活性を刺激または阻止する能力等を含むことになる。
【0350】
本発明はまた、予め決めた受容体(例えば、ペプチド性ホルモン受容体、細胞表面受容体、他のタンパク質と結合して、ヘテロ二量体等の細胞間タンパク質複合体を形成する細胞間タンパク質のような哺乳動物のタンパク質性受容体)またはエピトープ(例えば、固定化タンパク質、糖タンパク質、オリゴ糖等)に結合するライブラリーメンバーについて、初期ペプチド(一本鎖の抗体)を展示するポリソームのライブラリーをアフィニティースクリーニングすることにより、選択されたポリヌクレオチド配列のプールをシャッフルする方法を提供する。
【0351】
これら方法のいずれかによって、第1選択ラウンド(典型的には、受容体(例えば、リガンド)への結合についてのアフィニティー選択により)で選択されたポリヌクレオチド配列をプールし、該プールをin vitroおよび/またはin vivo組換えによりシャッフルして、組換えた選択ポリヌクレオチド配列の集団を含むシャッフル済プールを生成する。組換えた選択ポリヌクレオチド配列を、少なくとも1回次の選択ラウンドにかける。後の選択ラウンドで選択したポリヌクレオチド配列を直接使用して、配列決定し、および/または1回以上のシャッフリングおよび次の選択ラウンドに付す。選択した配列は、中立配列(すなわち、結合に不要な機能作用を及ぼす)をコードするポリヌクレオチド配列で、戻し交雑することもできる。この戻し交雑は、例えば、選択配列とほぼ同じ野生型または自然発生配列を用いた戻し交雑により実施して、免疫原性の低い、天然様の機能ペプチドを生成することができる。一般に、戻し交雑の間に、次の選択ラウンドを実施して、予め定めた受容体(リガンド)への結合特性を保持する。
【0352】
選択した配列のシャッフリングの前、または、これと同時に、配列に突然変異を誘発することができる。ある態様では、選択されたライブラリーメンバーを原核ベクター(例えば、プラスミド、ファージミド、またはバクテリオファージ)でクローン化する。この態様では、個々別々のライブラリーメンバーを表す個別のコロニー(またはプラーク)集団が生成される。次に、個別の選択ライブラリーメンバーを操作して(例えば、部位指向性突然変異誘発、カセット突然変異誘発、化学的突然変異誘発、PCR突然変異誘発等)、選択したライブラリーメンバーの配列に基づく配列多様性の核を呈示するライブラリーメンバーの集団を生成することができる。個別の選択ライブラリーメンバーまたはプールの配列を操作して、部分的に、あるいは、個別選択ライブラリーメンバー配列の全長にわたって、ランダム突然変異、擬似ランダム突然変異、規定核突然変異(すなわち、可変および不変残基位置を含む、および/または、規定サブセットのアミノ酸残基から選択した残基を含有する可能性のある可変残基位置を含む)、コドンに基づく突然変異等を組み込むことができる。次に、突然変異を誘発した選択ライブラリーメンバーを、本文に記載したin vitroおよび/またはin vivo組換えシャッフリングによりシャッフルする。
【0353】
本発明はまた、複数の本発明の個別ライブラリーメンバーを含むペプチドライブラリーであって、(1)該複数の個別ライブラリーメンバーの各々が、選択された配列のプールをシャッフリングして生成された配列を含み、(2)各個別ライブラリーメンバーが、上記複数のメンバーにおける他の個別ライブラリーメンバーの可変ペプチドセグメント配列または一本鎖抗体配列とは異なる可変ペプチドセグメント配列または一本鎖抗体セグメント配列を含む(しかし、ライブラリーメンバーの中には、不均質な増幅、確率論的確率等により、1ライブラリー当たり1つ以上存在するものもある)ことを特徴とするペプチドライブラリーを提供する。
【0354】
さらに、本発明は、工程毎の産物であって、予め決めた結合特異性が次の方法により形成されることを特徴とする産物を提供する:(1)予め決めた受容体(例えば、リガンド)またはエピトープ(例えば、抗原高分子)に対して、展示されるペプチドもしくは展示される一本鎖抗体ライブラリーをスクリーニングし、予め決めた受容体またはエピトープに結合するライブラリーメンバーを同定および/または富化して、選択ライブラリーメンバーのプールを生成し、(2)予め決めたエピトープに結合し、これによって、ライブラリーから単離および/または富化されている該選択ライブラリーメンバー(もしくは、増幅またはクローン化したそのコピー)を、組換えによりシャッフリングして、シャッフルライブラリーを生成し、(3)予め定めた受容体(例えば、リガンド)またはエピトープ(例えば、抗原高分子)に対して、該シャッフルライブラリーをスクリーニングし、予め定めた受容体またはエピトープに結合するシャッフルライブラリーメンバーを同定および/または富化して、選択されたシャッフルライブラリーメンバーのプールを生成する。
【0355】
抗体展示およびスクリーニング法
本発明を用いて、記載した方法のいずれか、ならびに、いずれかの組合せによるin vitroおよび/またはin vitro組換えによって、抗体展示方法により選択されるポリヌクレオチド配列をシャッフルすることができ、ここで、会合ポリヌクレオチドは、予め決めた抗体(リガンド)を結合する表現型(例えば親和性)についてスクリーニングした展示抗体をコードする。
【0356】
免疫グロブリン鎖に存在し得る膨大な数の個別可変領域によって示される広大な免疫レパートリーを獲得するために、様々な分子遺伝子的手法が考案されてきた。自然に発生する生殖系列免疫グロブリン重鎖遺伝子座は、縦列の多様性セグメント遺伝子の上流に位置する個別縦列の可変セグメント遺伝子から構成される。尚、上記多様性セグメント遺伝子自体は、縦列の連関(i)領域遺伝子の上流に位置し、この連関領域遺伝子は、定常領域遺伝子の上流に位置する。Bリンパ球発生の間、V−D−J転位が起こるが、このとき、融合Dセグメントを形成する転位、続いて、V−D−J結合産物遺伝子を形成するVセグメントでの転位により、重鎖可変領域遺伝子(VH)が形成される。尚、上記V−D−J結合産物遺伝子は、生産的に転位されれば、重鎖の機能的可変領域(VH)をコードする。同様に、軽鎖遺伝子座は、複数のVセグメントの一つを、複数のJセグメントの一つで再構成して、軽鎖の可変領域(VL)をコードする遺伝子を形成する。
【0357】
免疫グロブリンに生じ得る可変領域の広大なレパートリーは、B細胞発生における再構成中の、連関Vおよびiセグメント(ならびに、重鎖遺伝子座の場合には、Dセグメント)の多数の組合せの可能性に一部が由来する。これ以外に、重鎖可変領域の配列の多様性は、V−D−J結合中のDセグメントの非均質な再構成、ならびに、N領域の付加に由来するものである。さらに、特異的B細胞クローンの抗体選択は、重鎖および軽鎖可変領域の一方または両方に、非生殖系列突然変異を有する、親和性がより高い変異型を選択する(「親和性成熟」または「親和性シャープニング」と呼ばれる現象)。典型的に、これら「親和性シャープニング」突然変異は、可変領域の特異的区域、最も一般的には、相補性決定領域(CDR)にクラスター形成する。
【0358】
抗原刺激β細胞発生(すなわち、免疫)を介した高親和性免疫グロブリンの生成および同定における多数の制限事項を解決するために、様々な原核発現系が開発されてきたが、これらを操作して、特異的抗原に対する高親和性抗体を選別するためにスクリーニングされる組合せ抗体ライブラリーを生成することができる。大腸菌およびバクテリオファージ系での抗体の発現における近年の進歩(後述する「代替的ペプチド展示方法」を参照)により、特性決定したハイブリドーマから抗体遺伝子をクローニングすることによって、あるいは抗体遺伝子ライブラリー(例えばIg cDNA由来の)を用いたde novo選択のいずれかによって、ほぼすべての特異性が得られる可能性が出てきた。
【0359】
抗体の組合せライブラリーは、バクテリオファージプラークまたは溶原菌のコロニーとしてスクリーニングできるバクテリオファージλ発現系で生成されてきた(Huseら、1989;CantonおよびKoprowski、1990;Mullinaxら、1990;Perssonら、1991)。バクテリオファージ抗体展示ライブラリーおよびλファージ発現ライブラリーの様々な態様が記載されている(Kangら、1991;Clacksonら、1991;McCaffertyら、1990;Burtonら、1991;Hoogenboomら、1991;Changら、1991;Breitlingら、1991;Marksら、1991、p.581;Barbasら、1992;HawkinsおよびWinter、1992;Marksら、1992、p.779;Marksら、1992、p.16007;ならびに、Lowmanら、1991;Lernerら、1992;これらは、すべて、参照として本文に組み込む)。典型的には、バクテリオファージ抗体展示ライブラリーは、固定化した(例えば、クロマトグラフィー樹脂に共有結合して、アフィニティクリマトグラフィーによって反応性ファージを富化することにより)、および/または標識した(例えば、プラークまたはコロニーリフト(lifts)を選別するために)受容体(例えば、ポリペプチド、炭水化物、糖タンパク質、核酸)を用いてスクリーニングする。
【0360】
特に有利な手法は、いわゆる一本鎖フラグメント可変(scfv)ライブラリーの使用である(Marksら、1992、p.779;WinterおよびMilstein、1991;Clacksonら、1991;Marksら、1991、p.581;Chaudharyら;Chiswellら、1992;McCaffertyら、1990;ならびに、Hustonら、1988)。バクテリオファージコートタンパク質に展示されるscfvライブラリーの様々な態様が記載されている。
【0361】
1988年から、Fvフラグメントおよびそれらの融合タンパク質の一本鎖類似体が、抗体工学法により高い信頼度で生成されている。第1ステップは、一般に、所望の結合特性を有するVHおよびVLをコードする遺伝子を得ることから成る。これらのV遺伝子は、組合せV遺伝子ライブラリーから選択された、あるいは、V遺伝子合成により作製された特異的ハイブリドーマ細胞系から単離することができる。一本鎖Fvは、(Gly−Gly−Gly−Gly−Ser)3または同等のリンカーペプチド等の、適切に設計されたリンカーペプチドをコードするオリゴヌクレオチドと、成分V遺伝子とを結合することにより形成される。リンカーは、第1のV領域のC末端と、第2領域のN末端とを、VH−リンカー−VLまたはVL−リンカー−VH’のいずれかの順に架橋する。原則として、scfv結合部位は、その親抗体結合部位の親和性および特異性の両方を忠実に複製することができる。
【0362】
従って、scfvフラグメントは、柔軟なリンカーペプチドによりポリペプチド一本鎖に結合したVHおよびVLドメインから構成される。scfv遺伝子を構成した後、これらをファージミドにクローン化し、バクテリオファージPIII(遺伝子3)コートタンパク質を含む融合タンパク質として、M13ファージ(または類似した繊維状バクテリオファージ)の先端に発現させる。関心のある抗体を発現するファージの富化は、予め決めたエピトープ(例えば、標的抗原、受容体)への結合のための集団scfvを展示する組換え体ファージを選別することにより達成される。
【0363】
ライブラリーメンバーの結合ポリペプチドは、スクリーニングまたは選択手順の後に、ライブラリーメンバーの複製の基礎をもたらすと共に、展示されたペプチド配列またはVHおよびVLアミノ酸配列の同一性決定のための基礎を提供する。展示されたペプチド配列、または一本鎖抗体(例えばscfv)および/またはそのVHおよびVHドメイン、あるいはそれらのCDRをクローン化し、適した発現系で発現することができる。一般に、単離したVHおよびVLドメインをコードするポリヌクレオチドは、定常領域(CHおよびCL)をコードするポリヌクレオチドに連結することにより、完全抗体(例えば、キメラ、もしくは、完全にヒトの)、抗体フラグメント等をコードするポリヌクレオチドを作製する。また、一般に、単離したCDRをコードするポリヌクレオチドは、適した可変領域フレームワーク(および任意で、定常領域)をコードするポリヌクレオチドに移植することにより、完全抗体(例えば、ヒト化した、もしくは、完全にヒトの)、抗体フレームワーク等をコードするポリヌクレオチドを作製する。抗体を用いて、免疫アフィニティクロマトグラフィーにより、抗原の調製量を分離することができる。上記以外のこれらの抗体の各種用途として、疾病(例えば、腫瘍新生)の診察および/または病期分類、疾病(例えば、腫瘍新生、自己免疫疾患、AIDS、心臓血管疾患、感染等)の治療のための使用がある。
【0364】
結合する種のレパートリー(イディオタイプスペクトル)を拡大するために、scfvライブラリーの組合せ多様性を増加する様々な方法が報告されている。PCRを使用することにより、可変領域が、特異的ハイブリドーマ源から、または非免疫細胞からの遺伝子ライブラリーとして、急速にクローン化することができ、結合させることのできるVHおよびVLカセットの配列の組合せ多様性をもたらす。さらに、VHおよびVLカセットは、ランダム、擬似ランダム、または指向性突然変異誘発等により、それ自体で、多様化することができる。典型的には、VHおよびVLカセットは、相補性決定領域(CDR)内または近傍で多様化するが、第3CDR、すなわち、CDR3で多様化することが多い。酵素によるインバースPCR突然変異誘発は、誤りがちなPCRや化学的突然変異誘発(Dengら、1994)と同様に、scfv部位指向性ハイブリッドの比較的大きなライブラリーを形成するための、単純かつ信頼度の高い方法であることが明らかにされている(Stemmerら、1993)。Riechmann(Riechmannら、1993)は、縮合オリゴヌクレオチドPCR、次に、得られたscfvハイブリッドのファージ展示による部位指向性ランダム化を用いた、抗体scfvフラグメントの半合理的設計を明らかにした。Barbas(Barbasら、1992)は、ヒト破傷風トキソイド結合Fabの合成CDR領域内の配列をランダム化することにより、偏った可変領域配列の使用に起因するレパートリーサイズの制限に関する問題を解決しようとした。
【0365】
CDRランダム化によって、重鎖CDR3だけについて約1x1020個のCDR、ほぼ同じ数の重鎖CDR1およびCDR2の変異型、ならびに軽鎖CDR1−3変異体が産生する可能性がある。個別または一緒に用いた、重鎖および/または軽鎖のCDRランダム化の組合せの可能性は、非常に多数のバクテリオファージクローンを生成して、あらゆる可能な組合せを呈示するクローンライブラリーを作製することを必要とする。これらの大部分は、非結合性である。このように膨大な数の主要形質転換細胞を生成することは、現在の形質転換技術およびバクテリオファージ展示系では実現不可能である。例えば、Barbas(Barbasら、1992)は、5x10の形質転換細胞しか生成しなかったが、これは、完全にランダム化したCDRライブラリーの潜在的多様性のごく一部を呈示するに過ぎない。
【0366】
これらの重大な制限にも拘わらず、scfvのバクテリオファージ展示によって、様々な有用な抗体および抗体融合タンパク質がすでに得られている。二重特異性一本鎖抗体が、効率的な腫瘍細胞の溶菌を仲介することがわかっている(Gruberら、1994)。抗Rev scfvの細胞内発現は、in vitro HIV−1ウイルス複製を阻害し(Duanら、1994)、抗p21rar、scfvの細胞内発現が、アフリカツメガエルの卵母細胞の減数***を阻害することが明らかにされている(Bioccaら、1993)。また、HIV感染を診断するのに使用することができる組換えscfvも報告されており、scfvの診断有用性を証明している(Lilleyら、1994)。毒素や繊維素溶解アクチベータータンパク質等、第2ポリヌクレオチドにscFvを結合する融合タンパク質も報告されている(Holvostら、1992;Nichollsら、1993)。
【0367】
広範な抗体多様性を有し、そして見込まれる配列組合せのごく一部しか扱えない従来のCDR突然変異誘発およびランダム化方法の制限事項の多くを解決するscFvを生成することができれば、治療および診断に使用するのに適したscfvの数および品質を大幅に改善できるであろう。この課題に取り組むため、本発明のin vitroおよびin vivoシャッフリング方法を用いて、選択した展示抗体由来の核酸から取得した(典型的には、PCR増幅またはクローニングを通して)CDRを組み換える。このような展示抗体は、細胞、バクテリオファージ粒子、ポリソーム、あるいは、抗体が、そのコード核酸を伴うあらゆる適切な抗体展示系に展示することができる。ある態様では、CDRは、初め、抗体産生細胞(例えば、免疫された野性型マウス、ヒト、あるいは、WO92/03918、WO93/12227およびWO94/25585号に記載されているように、ヒト抗体を産生可能なトランスジェニックマウス由来のプラズマ細胞/脾細胞)(これらに由来するハイブリドーマを含む)からのmRNA(またはcDNA)から取得する。
【0368】
上記方法のいずれかにより、第1選択ラウンドで選択したポリヌクレオチド配列(典型的には、抗原(例えば、リガンド)に結合する展示抗体の親和性選択による)をプールし、このプールを、in vitroおよび/またはin vivo組換え、特に、CDRのシャッフリング(典型的には、重鎖CDRを他の重鎖CDRで、軽鎖CDRを他の軽鎖CDRでシャッフリングする)によりシャッフルして、組換え選択ポリヌクレオチド配列の集団から成るシャッフル済プールを生成する。組換え選択ポリヌクレオチド配列は、展示抗体として、選択フォーマットに発現させ、次に、少なくとも1回の選択ラウンドに付す。後の選択ラウンドで選択したポリヌクレオチド配列を直接使用し、配列決定し、および/または、所望の結合親和性が得られるまで、1回以上のシャッフリングおよび選択の追加ラウンドに付す。選択した配列は、例えば、ヒト可変領域フレームワークを用いた戻り交雑により、中立抗体フレームワーク配列(すなわち、抗原結合に不要な機能的作用を及ぼすもの)をコードするポリヌクレオチド配列で戻り交雑して、ヒト様配列抗体を産生することも可能である。一般に、戻り交雑の間、次の選択を実施して、予め決めた抗原に対する結合特性を保持する。
【0369】
これに代わり、あるいは、上記態様と組み合わせて、標的エピトープの抗体価を変えて、選択したscfvライブラリーメンバーの平均結合親和性を制御することも可能である。標的エピトープを、競合エピトープの含有、希釈、またはその他の当業者には公知の方法等によって、密度を変えながら、表面または基質に結合することができる。低密度(抗体価)は、親和性が高い方のscfvライブラリーメンバーを優先的に富化するのに対し、高密度(抗体価)の予め決定したエピトープを用いて、親和性が比較的低いscfvライブラリーメンバーを富化することができる。
【0370】
多様な可変セグメントを生成するために、ランダム、擬似ランダム、またはペプチド配列の規定配列核セットをコードする合成オリゴヌクレオチドの集団を連結反応により、予め決めた部位(例えば、CDR)に挿入することができる。同様に、部位指向性突然変異誘発やCDR置換等で、CDRを突然変異させることにより、一本鎖抗体カセットの一つ以上のCDRの配列多様性を拡大することも可能である。シャッフリング前のクローニングおよび増幅のために、得られたDNA分子を宿主中で増殖させる、あるいは、直接使用する(すなわち、宿主細胞中の増殖時に起こり得る多様性の損失を回避する)ことができ、次に、選択したライブラリーメンバーをシャッフルする。
【0371】
関心のある可変セグメントペプチド配列、または関心のある一本鎖抗体をコードする展示ペプチド/ポリヌクレオチド複合体(ライブラリーメンバー)を、親和性富化方法により、ライブラリーから選択する。これは、受容体やその他の高分子、あるいは、その他のエピトープ種等、関心のあるペプチド配列について特異的な固定化高分子またはエピトープを用いて、達成する。親和性選択手順を繰り返すことにより、所望の配列をコードするライブラリーメンバーの富化が達成され、これらメンバーを単離して、プールおよびシャッフリング、配列決定、および/または、更なる増幅ならびに親和性富化が可能である。
【0372】
所望の特異性を持たないライブラリーメンバーは、洗浄により除去する。必要な洗浄の度合いおよびストリンジェンシーは、各ペプチド配列または関心のある一本鎖抗体、ならびに、固定化され予め決定した高分子またはエピトープに応じて、決定する。結合インキュベーションの条件および後の洗浄を調節することにより、回収した発生ペプチド/DNA複合体の結合特性に対し、ある程度の制御を及ぼすことができる。温度、pH、イオン強度、二価カチオン濃度、ならびに、洗浄の量および時間は、固定された高分子の親和性の特定範囲内で、発生ペプチド/DNA複合体について選択する。遅い解離速度に基づく選択は、通常、高い親和性を予測させるが、最も実用的な方法であることが多い。これは、飽和量の予め決めた遊離高分子の存在下での連続的インキュベーション、あるいは、洗浄の量、回数、および時間の増加のいずれかにより、実施できる。いずれの場合にも、解離した初期ペプチド/DNAまたはペプチド/RNA複合体の結合が阻害され、時間を引き延ばすほど、親和性の高い発生ペプチド/DNAまたはペプチド/RNA複合体が回収される。
【0373】
結合および洗浄手順をさらに変更して、特殊な特徴を有するペプチドを取得することもできる。親和性が、イオン強度もしくは陽イオン濃度に左右されるペプチドもある。これは、ペプチドからタンパク質を除去するのに、穏やかな条件が求められるとき、各種タンパク質の親和性精製に用いられるペプチドについて、有用な特徴である。
【0374】
ある態様では、複数の結合標的(複数のエピトープ種、複数の受容体種)を使用することにより、様々な結合特異性を有する多数のscfvについて、scfvライブラリーを同時にスクリーニングすることができる。scfvライブラリーのサイズが、見込まれるscfv配列の多様性を制限することから、典型的には、サイズが可能な限り大きなscfvライブラリーを用いるのが望ましい。所定数の非常に大きなポリソームscfv表示ライブラリーを生成する上での時間および経済的要件は、膨大なものになる。この重大な問題を避けるために、複数の予め決めたエピトープ種(受容体種)を単一ライブラリーで、同時にスクリーニングする、あるいは、所定数のエピトープ種に対する逐次的スクリーニングを実施することができる。ある態様では、それぞれ個別のビーズ(もしくはビーズのサブセット)にコードされた多数の標的エピトープ種を混合し、適切な結合条件下でポリソーム表示scfvライブラリーとインキュベートすることができる。複数のエピトープ種を含むビーズの集団を用いて、親和性選択によりscfvライブラリーメンバーを単離することができる。一般に、後の親和性スクリーニングラウンドは、ビーズの同じ混合物、そのサブセット、あるいは、一つまたは二つの個別エピトープ種を含むビーズを含み得る。この手法は、効率的スクリーニングを可能にし、研究室の自動化、バッチ処理、ならびにハイスループットスクリーニング法と両立するものである。
【0375】
本発明においては、様々な方法を用いて、ペプチドライブラリーまたは一本鎖抗体ライブラリーを多様化する、あるいは、シャッフリング前またはこれと同時に、初期選別ラウンドで得られるほぼ可変のセグメントペプチドを多様化して、予め決めた高分子またはエピトープに対する十分な結合活性を得ることができる。ある手法では、ポジティブな選択ペプチド/ポリヌクレオチド複合体(親和性強化の初期ラウンドで同定されたもの)を配列決定して、活性ペプチドのアイデンティティを決定する。次に、一次オリゴヌクレオチド配列の軽度の変異を生成するための各ステップで組み込まれた低レベルの全塩基を用いて、これらの活性ペプチド配列に基づき、オリゴヌクレオチドを合成する。適した位置でのこの(軽度)縮合オリゴヌクレオチドの混合物を可変セグメント配列中にクローニングする。この方法は、出発ペプチド配列の、体系的な、制御された変異を生成し、次にこれをシャッフリングすることができる。しかし、これには、個別のポジティブな初期ペプチド/ポリヌクレオチド複合体を突然変異誘発前に配列決定する必要があり、従って、回収した少数の複合体の多様性を拡大し、親和性および/または結合特異性がより高い変異体を選択するのに有用である。ある態様では、ポジティブな選択ペプチド/ポリヌクレオチド複合体(特に、可変領域配列の複合体であり、その増幅産物は、スクリーニングの1以上の追加ラウンドで、in vitroおよび/またはin vivoでシャッフリングする)の突然変異誘発PCR増幅は、配列決定の前に実施する。同じ一般的手法を一本鎖抗体と共に用いて、典型的には、シャッフリングの前またはこれと同時に、CDRまたは隣接するフレームワーク領域を多様化することにより、多様性を拡大し、結合親和性/特異性を増大することができる。所望であれば、シャッフリング反応を、選択ライブラリーメンバーによるin vitro組換えが可能な突然変異原性オリゴヌクレオチドで強化してもよい。従って、合成オリゴヌクレオチドおよびPCR生成ポリヌクレオチド(エラー−プローン法、もしくは忠実度の高い方法で合成した)をin vitroシャッフリングミックスに添加し、得られるシャッフリング済ライブラリーメンバー(シャフラント)に組み込むことができる。
【0376】
本発明のシャッフリングは、CDR突然変異体一本鎖抗体の膨大なライブラリーの生成を可能にする。このような抗体を生成する一つの方法は、シャッフリングの前、もしくは、これと同時に、合成CDRを、一本鎖抗体および/またはCDRランダム化に挿入することである。合成CDRカセットの配列は、ヒトCDRの既知の配列データを参照して、選択すると共に、次の指針に従い、実験者の判断で選択する:合成CDRは、既知のCDR配列に対して、少なくとも40%位置配列同一性を有し、好ましくは、既知のCDR配列に対して、少なくとも50〜70%位置配列同一性を有する。例えば、Kabat(Katatら、1991)に列挙された自然発生のヒトCDR配列に基づいて、オリゴヌクレオチド配列の集団を合成することにより、合成CDR配列の集団を生成することができる。合成CDR配列のプールを計算し、少なくとも一つの既知自然発生ヒトCDR配列に対して、少なくとも40%の配列同一性を有するCDRペプチド配列をコードする。あるいは、自然発生CDR配列の集団を比較して、共通配列を生成することにより、残基位置でよく用いられるアミノ酸(既知CDR配列の少なくとも5%)を対応する位置で、合成CDRに組み込む。典型的には、複数(例えば、3〜約50)の既知CDR配列を比較し、既知のCDR間に認められる天然配列の多様性について表を作成する。次いで、認められた天然配列多様性の全部もしくは、ほとんどの順列を包含するCDRペプチド配列をコードするオリゴヌクレオチドの集団を合成する。非制限的例として、ヒトVH CDR配列の集団が、Tyr、Val、Phe、またはAspのいずれかであるカルボキシ−末端アミノ酸を有する場合には、カルボキシ末端CDR残基が、上記アミノ酸のいずれかとなるように、合成CDRオリゴヌクレオチド配列のプールを設計する。いくつかの態様では、CDR配列の集団において残基位置で自然に発生するもの以外の残基が組み込まれる。同類アミノ酸置換が組み込まれることが多く、5つまでの残基位置が、既知の自然発生CDR配列と比較して、非同類アミノ酸置換を組み込むように変化され得る。このようなCDR配列は、一次ライブラリーメンバーで使用する(第1選択ラウンド前に)および/または、選択したライブラリーメンバー配列のin vitroシャッフリング反応をスパイクするのに使用することができる。規定および/または縮重配列のこのようなプールの構築は、当業者であれば、容易に達成するであろう。
【0377】
合成CDR配列の集団は、自然発生のCDR配列であることが知られていない、少なくとも1つのメンバーを含んでいる。実験者の判断で、重鎖CDRへのN領域付加に対応するランダムまたは擬似ランダム配列の一部を含んでもよいし、また、含まなくてもよい。尚、N領域配列は、V−DおよびD−J結合部に発生する1ヌクレオチド〜約4ヌクレオチドの範囲である。合成重鎖CDR配列の集団は、少なくとも約100ユニークCDR配列、典型的には、少なくとも約1,000ユニークCDR配列、好ましくは少なくとも約10,000ユニークCDR配列、多くの場合、50,000以上のユニークCDR配列を含むが、1x106を超えるユニークCDR配列は該集団に含まれない。しかし、場合によっては、特に、自然発生のヒトCDR中の位置において、同類アミノ酸置換が存在しない、あるいは稀である(すなわち、0.1%以下)位置で、同類アミノ酸置換可能な場合、1x107〜1x108ユニークCDR配列が存在する。一般には、ライブラリーに含まれるユニークCDRの数は、ライブラリー中の一次形質転換細胞の予測数を因数10以上超えてはならない。このような一本鎖抗体は、一般に、少なくとも、約1x10m−、好ましくは、少なくとも約5x10M−1、さらに好ましくは、少なくとも1x10M−1〜1x10M−1、時には1x1010M−1まで、またはそれ以上の親和性で結合する。多くの場合、予め決めた抗原は、例えば、ヒト細胞表面抗原(例えば、CD4、CD8、IL−2受容体、EGF受容体、PDGF受容体)、その他のヒト生物学的高分子(例えば、トロンボモジュリン、タンパク質C、炭水化物抗原、シアリルルイス抗原、Lセレクチン)等のヒトタンパク質、あるいは、非ヒト疾病関連高分子(例えば、細菌性LPS、ビリオンカプシドタンパク質またはエンベロープ糖タンパク質)等である。
【0378】
所望の特異性を有する高親和性一本鎖抗体を操作し、様々な系で発現させることができる。例えば、scfvは、植物中で生成されており(Firekら、1993)、原核細胞の系でも容易に生成させることができる(QwensおよびYoung、1994;JohnsonおよびBird、1991)。さらに、一本鎖抗体を、全抗体もしくはその各種フラグメントを形成するための基礎として用いることもできる(Kettleboroughら、1994)。配列をコードする可変領域を単離し(例えば、PCR増幅またはサブクローニングにより)、免疫原性が好ましく最小限になるヒトの治療用途にさらに適したヒト配列抗体をコードするように、所望のヒト定常領域をコードする配列にスプライスする。得られた完全にヒトのコーディング配列を有するポリヌクレオチドを宿主細胞(例えば、哺乳動物細胞の発現ベクター由来の)に発現させ、薬剤配合物調製のために精製することができる。
【0379】
DNA発現構築物には、典型的に、自然付随または異種プロモーター領域を含むコーディング配列に操作可能に結合した発現制御DNA配列が含まれる。好ましくは、この発現制御配列は、真核宿主細胞を形質転換もしくはトランスフェクトすることが可能なベクターにおける真核プロモーター系である。ベクターを適切な宿主に組み込んだ後、ヌクレオチド配列の高レベル発現に適した条件に宿主を維持し、突然変異体「操作」抗体を回収および精製する。
【0380】
既に述べたように、DNA配列は、該配列を発現制御配列に操作可能に結合した(すなわち、構造遺伝子の転写および翻訳を確実するように配置させた)後、宿主中で発現させる。これらの発現ベクターは、典型的に、エピソームまたは宿主染色体DNAの一部のいずれかとして、宿主生物で複製可能である。一般に、発現ベクターは、選択マーカー、例えば、テトラサイクリンまたはネオマイシンを含む、所望のDNA配列で形質転換した細胞の検出を可能にする(例えば、USPN第4,704,362号を参照。尚この文献は、参照として本文に組み込む)。
【0381】
酵母等の真核微生物の他に、哺乳動物の組織細胞培養を用いて、本発明のポリペプチドを生成することもできる(Winnacker、1987を参照。尚、この文献は参照として本文に組み込む)。無傷の免疫グロブリンを分泌できる適切な宿主細胞系がいくつか開発されていることから、実際には、真核細胞が好ましい。この真核細胞には、CHO細胞系、各種COS細胞系、HeLa細胞、ならびに骨髄腫細胞系が含まれるが、形質転換したB細胞またはハイブリドーマが好ましい。これら細胞の発現ベクターとしては、複製起点、プロモーター、エンハンサー等の発現制御配列(Queenら、1986)、ならびに、リボソーム結合部位、RNAスプライス部位、ポリアデニル化部位および転写ターミネーター配列等の必要処理情報部位が挙げられる。好ましい発現制御配列は、免疫グロブリン遺伝子、サイトメガロウイルス、SV40、アデノウイルス、ウシ乳頭腫ウイルス等に由来するプロモーターである。
【0382】
真核DNA転写は、ベクターにエンハンサー配列を挿入することにより、増加させることができる。エンハンサーは、プロモーターによる転写を増加する10〜300bpのシス作用配列である。エンハンサーは、転写ユニットに対して51または31のいずれかのとき、転写を効果的に増加する。これらのエンハンサーはまた、イントロン内、あるいは、コーディング配列自体内に位置するときも、効果的である。典型的に、ウイルスエンハンサーを用いるが、これらには、SV40エンハンサー、サイトメガロウイルスエンハンサー、ポリオーマエンハンサー、ならびにアデノウイルスエンハンサーが含まれる。また、マウス免疫グロブリン重鎖エンハンサー等、哺乳動物系由来のエンハンサー配列もよく用いられている。
【0383】
哺乳動物発現ベクター系はまた、典型的に、選択可能な標識遺伝子を含む。適した標識の例として、ジヒドロ葉酸レダクターゼ遺伝子(DHFR)、チミジンキナーゼ遺伝子(TK)、あるいは、薬物耐性を付与する原核細胞遺伝子が挙げられる。初めの二つの標識遺伝子は、増殖培地にチミジンを添加せずには増殖する能力がない変異体細胞系を使用するのが好ましい。次に、非補充培地での増殖能力によって、形質転換した細胞を同定する。標識として有用な原核の薬物耐性遺伝子の例として、G418に耐性を賦与する遺伝子、ミコフェノール酸およびハイグロマイシンがある。
【0384】
目的のDNAセグメントを含むベクターを、細胞宿主の種類に応じて、周知の方法により宿主細胞に移入させることができる。例えば、原核細胞には、一般に、塩化カルシウムトランスフェクションを使用するが、他の細胞宿主には、リン酸カルシウム処理、リポフェクション、もしくは、電気穿孔を用いてもよい。哺乳動物細胞を形質転換するのに使用される他の方法には、ポリブレン、プロトプラスト融合、リポソーム、電気穿孔、ならびに、マイクロインジェクション(概要は、Sambrookら、1982および1989を参照)等が挙げられる。
【0385】
発現した後、本発明に従う突然変異を起こした個々の免疫グロブリン鎖、突然変異を起こした抗体フラグメント、ならびに、その他の免疫グロブリンポリペプチドを、硫酸アンモニウム沈殿、フラクションカラムクロマトグラフィー、ゲル電気泳動等の標準的手順に従って精製することができる(概要は、Scopes、1982を参照)。所望により、部分的に、あるいは均一になるまで精製した後、ポリペプチドを、治療のために使用したり、もしくは、検定手順、免疫蛍光染色等を開発および実施するのに使用することができる(概要は、LefkovitsおよびPernis、1979および1981;Lefkovits、1997を参照)。
【0386】
本発明の方法により生成した抗体は、診断および治療に使用できる。非制限的な例として、これら抗体を用いて、癌、自己免疫疾患、もしくはウイルス感染を処置することができる。癌の処置のためには、上記抗体は、典型的に、erbB−2、CEA、CD33、ならびに、当業者には周知のその他多数の抗原および結合メンバー等、癌細胞に優先的に発現した抗原に結合する。
【0387】
末端選択
本発明は、ポリヌクレオチドの出発セットから、ポリヌクレオチドのサブセットを選択する方法であり、実施ポリヌクレオチドのどこにでも存在する1つ以上の選択可能な特徴(すなわち選択マーカー)を識別する能力に基づいて、各選択可能なポリヌクレオチドの受容(正の)および/または拒絶(負の)選択が実施できるようにする方法を提供する。好ましい形態では、末端選択と呼ばれる方法が提供されるが、この方法は、選択可能なポリヌクレオチドの末端領域に一部もしくは全体が位置する選択マーカーの使用に基づくものであり、このような選択マーカーを「末端選択マーカー」と呼ぶこともある。
【0388】
末端選択は、たとえ同一ポリヌクレオチド内でも、天然配列の検出、または、実験(本明細書に記載した、もしくは記載されていないあらゆる突然変異誘発方法を含む)により導入した配列の検出、あるいは、両方に基づくものである。末端選択マーカーは、構造的選択マーカーまたは機能的選択マーカー、あるいは構造的および機能的選択マーカーの両方のいずれでもよい。末端選択マーカーは、ポリヌクレオチド配列またはポリペプチド配列、もしくは、化学的構造、あるいは生物学的または生化学的タグから成るものでよく、放射能検出、酵素活性、蛍光、光学的特徴、磁気特性(磁気ビーズを用いて)、免疫反応性、ならびにハイブリダイゼーションの検出に基づく方法を用いて選択できるマーカーが含まれる。
【0389】
末端選択は、突然変異誘発の実施に有用なあらゆる方法と組み合わせて使用することもできる。このような突然変異誘発法には、限定しないが、本明細書に記載した方法(前述および後述)が含まれる。このような方法の非制限的な例として、次の用語で呼ばれる、本明細書に記載した、あるいは、他の文献に記載されているあらゆる方法が挙げられる:「飽和突然変異誘発」、「シャッフリング」、「組換え」、「再集合」、「誤りがちな(error−prone)PCR」、「集合PCR」、「セクシャルPCR」、「乗換えPCR」、「オリゴヌクレオチドプライマー特異的突然変異誘発」、「周期的(および/または指数)アンサンブル突然変異誘発(ArkinおよびYouvan、1922を参照)、「カセット突然変異誘発」、「in vivo突然変異誘発」、「in vitro突然変異誘発」。さらに、末端選択は、あらゆる突然変異誘発および/または増幅方法(例えば、Arnold、1993;CardwellおよびJoyce、1992;Stemmer、1994を参照;望ましい子孫分子の選択(これら分子の存在のスクリーニングも含む)をする上で、使用することが好ましい方法))により生成された分子について実施することもできる。
【0390】
さらに、末端選択は、突然変異誘発法以外にも、ポリヌクレオチドに使用することができる。好ましい実施形態では、本明細書に記載した末端選択を用いて、別のポリヌクレオチドへの連結ステップ(ベクターへの連結を含む)等、クローニングステップを促進することができる。従って、本発明は、ライブラリーの作製、望ましいポリヌクレオチドの選択および/または強化、ならびに一般的クローニングを促進するための有用な手段としての末端選択に関する。
【0391】
特に好ましい実施形態では、末端選択は、ポリヌクレオチドの(正の)選択、あるいはポリヌクレオチドの(負の)選択に基づく。さらには、末端選択は、(正の)選択および(負の)選択の両方に基づく。末端選択は、他の選択および/またはスクリーニング法と共に、同様の、もしくは異なる選択および/またはスクリーニング法、ならびに有用な突然変異誘発法と組み合わせて、相互作用的に実施することができる。これらの方法はすべて、相互作用的に、しかも、どんな順序、組合せ、ならびに順列で行ってもよい。
【0392】
また、本発明のある実施形態によれば、末端選択を用いて、少なくとも一部が、環状のポリヌクレオチド(例えば、プラスミドまたはその他の環状ベクター、もしくは、部分的に環状のその他プラスミド)、および/または分枝、および/または、化学基または部分で、修飾した、もしくは、置換したポリヌクレオチドを選択することもできる。この実施形態によれば、ポリヌクレオチドは、中間または中央領域から成る環状分子である。該領域は、5’フランキング領域(これは、末端選択のために、非環状ポリヌクレオチドの5’末端領域と同様の働きをする)により5’側に、また、3’末端領域(これは、末端選択の目的のために、非環状ポリヌクレオチドの3’末端領域と同様の働きをする)によって3’側に存在する。この非制限的例で用いられるように、いずれか二つの領域間に、あるいは三つすべての領域間でも、配列のオーバーラップがある可能性がある。
【0393】
本発明の非制限的形態では、線状ポリヌクレオチドの末端選択は、ポリヌクレオチド末端または複数の末端(5’末端または3’末端のいずれでもよい)、あるいはその近傍に位置する少なくとも一つの末端選択マーカーの存在に基づく一般的手法を用いて実施する。ある非制限的例では、末端選択は、ポリヌクレオチド配列を認識する酵素に認識される配列等(しかし、これに制限されない)の末端またはその近傍の特定配列の選択に基づく。ポリヌクレオチドの化学的修飾を認識し、触媒する酵素は、本書では、ポリヌクレオチド作用酵素と呼ぶ。好ましい態様では、有用なポリヌクレオチド作用酵素の非制限的例として、ポリヌクレオチド切断活性を有する酵素、ポリヌクレオチドメチル化活性を有する酵素、ポリヌクレオチド連結活性を有する酵素、ならびに、複数の異なる酵素活性を有する(非制限的に、例えば、ポリヌクレオチド切断活性とポリヌクレオチド連結活性の両方を有するもの等)酵素が挙げられる。
【0394】
従って、該当するポリヌクレオチド活性酵素には、市場で入手可能な、または、入手できないポリヌクレオチドエンドヌクレアーゼ、ならびにそのコンパニオンメチラーゼも含まれ、ウェブサイトhttp://www.neb.com/rebaseで閲覧できるもの、ならびに下に引用する文献(RobertsおよびMaceli、1996)に記載されているものが挙げられる。好ましいポリヌクレオチドエンドヌクレアーゼとしては、限定しないが、II型制限酵素(IIS型を含む)があり、二本鎖ポリヌクレオチドの両方の鎖を切断する酵素(例えば、5’...GC/GGCCGC...3’で両方の鎖を切断するNotI)や、二本鎖ポリヌクレオチドの一方の鎖だけを切断する酵素、すなわち、ポリヌクレオチド−ニッキング活性を有する酵素(例えば、5’...GAGTCNNNN/N...3’で一方の鎖だけを切断するN.BstNBI)を挙げることができる。また、該当するポリヌクレオチド作用酵素には、III型制限酵素も含まれる。
【0395】
さらに、該当するポリヌクレオチド作用酵素には、現在は入手できないが、将来開発される可能性のある酵素で、ポリヌクレオチドに、連結適合末端、特に、付着末端を生成するのに有用な酵素が含まれる。
【0396】
好ましい一例では、有用な選択マーカーは、ポリヌクレオチドの制限部位で、この部位は、対応するII型(またはIIS型)制限酵素に、ポリヌクレオチド末端を切断させ、ポリヌクレオチド内の所望の内部配列を破壊することのないように、ポリヌクレオチドの内部を切断することなく、所望の連結反応に有用な連結可能末端(少なくとも一つの塩基オーバーハングを有する平滑末端または付着末端を含む)を提供する。従って、対応する制限酵素の使用が、実施ポリヌクレオチドを内部で切断することを目的としない場合には、該当する制限部位の中でも、実施する特定のポリヌクレオチド内で、内部に存在しない(すなわち、末端以外には存在しない)部位が好ましい。これによって、使用するポリヌクレオチドの不要な内部切断を招くことなく、制限消化反応を完了、もしくは完了近くまで実施することができる。
【0397】
従って、好ましい形態によれば、末端選択に付そうとするポリヌクレオチドの内部に含まれない、または、含まれないと予想される、あるいは含まれないと思われる(例えば、実施ポリヌクレオチドに関する配列情報が不完全な場合)制限部位を使用するのが好ましい。この形態によれば、よく存在するものよりも、比較的稀にしか存在しない制限部位の方が、通常好ましいことに留意されたい。これに対し、例えば、末端選択と共に、組換え、もしくはその他の突然変異誘発方法を実施するために、ポリペプチドの内部切断を所望する場合もある。
【0398】
また、この発明によれば、不要な内部制限部位を除去するための方法(例えば、突然変異誘発方法)を使用することもできる。さらに、部分的消化反応(すなわち、部分的完了まで進行する消化反応)を用いて、末端領域の認識部位で消化を達成すると同時に、ポリペプチドの内部に発生し、しかも、同じ酵素により認識される感受性の高い制限部位を共有する。ある形態では、特定の酵素が、認識配列が発生する位置および環境に応じて、同じ認識配列の好ましい切断を提示することから、部分的消化が有用である。例えば、λDNAは、5つのEcoRI部位を有するが、右末端に最も近い部位の切断は、分子の中央にある部位の10倍以上の速さで発生することが報告されている。また、例えば、Sac IIはλDNAに4つの部位を有するが、そのうちの3つは中央にクラスター化し、末端に最も近い残った部位(ヌクレオチド40,386での)よりも50倍速く切断される。すなわち、多くの研究者が、各種酵素について、部位優先を報告している(例えば、ThomasおよびDavis、1975;Forsblumら、1976;NathおよびAzzolina、1981;BrownおよびSmith、1977;GingerasおよびBrooks、1983;Krugerら、1988;ConradおよびTopal、1989;Ollerら、1991;Topal、1991;ならびにPein、1991;ほんの一例を挙げたにすぎない)。現在入手可能か、あるいは、将来入手可能かに拘わらず、使用するポリヌクレオチド作用酵素による部位優先の、経験による観察、ならびに、機械論的知識が、本発明による末端選択に役立つであろう。
【0399】
保護方法を用いて、酵素による不要な消化から指定制限部位(例えば、内部部位)を選択的に保護することができるが、保護しない場合には、該酵素は、これらの部位の存在に応答して、実施中のポリヌクレオチドを切断する恐れがある。このような保護方法には、不要な酵素活性を阻害する、メチル化や塩基置換(例えば、Tの代わりにU)等の修飾が含まれる。大きな(例えば、長さがメガ単位の)制限フラグメントを作製するのに十分希有な(例えば、非常に長い認識配列を有する)制限酵素の数は限られており、酵素切断部位の希有性を高めるためには、保護手法(例えば、メチル化による)が有用であることに留意すべきである。NotIの見掛け希有性を高めるためのM.FnuII(mCGCG)の約二倍使用は、多数のうちの一例にすぎない(Qiangら、1990;Nelsonら、1984;MaxamおよびGilbert、1980;RaleighおよびWilson、1986)。
【0400】
本発明の好ましい形態によれば、一般に、希有な切断部位の使用が好ましいことを特徴とする。一般には、制限部位の発生頻度は、そこに含まれるヌクレオチドの数、ならびに、そこに含まれる塩基要求の多義性によって決定される。従って、非制限的例では、例えば、8つの特異的ヌクレオチドから成る制限部位(例えば、4に1、すなわち、65,536に1の推定相対発生率を有するNotI部位すなわちGC/GGCCGC、ランダム8−mers)は、例えば、6つのヌクレオチドから成るもの(例えば、4に1、すなわち、4,096に1の推定相対発生率を有するSmaI部位すなわちCCC/GGG、ランダム6−mers)よりも比較的頻度が低く、例えば、4つのヌクレオチドから成るもの(例えば4に1、すなわち、256に1の推定相対発生率を有するMspI部位すなわちC/CGG、ランダム4−mers)よりも比較的頻度が低い。さらに、別の非制限的例では、一般に、多義性の(しかし非常に特異的な)塩基要求を持たない制限部位(例えば、4に1、すなわち、1024に1の推定相対発生率を有するFinI部位すなわちCTCCC、ランダム5−mers)は、多義性W(ただし、W=AまたはT)塩基要件を有するもの(例えば、4x4x2x4x4に1、すなわち、512に1の推定相対発生率を有するAvaII部位すなわちG/GWCC−ランダム5−mers)より比較的頻度が低いが、多義性N(ただし、N=AまたはCまたはGまたはT)塩基要求を有するもの(例えば、4x4x1x4x4に1、すなわち、256に1の推定相対発生率を有するAsuI部位すなわちG/GNCC−ランダム5−mers)より比較的頻度が低い。これらの相対発生率は、特異的ヌクレオチド塩基(特異的ヌクレオチド配列はいうまでもなく)が、特異的ポリヌクレオチド、特異的種の生物、ならびに特異的グループの生物に、異なる頻度で発生することが認められるため、実際ポリヌクレオチドの大まかな推定値と考えられる。例えば、異なる種の生物の%G+C含有率は、非常に異なることが多く、しかも広い範囲で変動する。
【0401】
選択標識として使用する比較的稀な制限部位には、非制限的に、好ましくは、少なくとも4ヌクレオチド配列から成る部位、さらに好ましくは、少なくとも5ヌクレオチド配列から成るもの、さらに好ましくは、少なくとも6ヌクレオチド配列から成るもの(例えば、BamHI部位すなわちG/GATCC、BglII部位すなわちA/GATCT、PstI部位すなわちCTGCA/G、ならびにXbaI部位すなわちT/CTAGA)、さらに好ましくは、少なくとも7ヌクレオチド配列から成るもの、さらに好ましくは、少なくとも8ヌクレオチド配列から成るもの(例えば、AscI部位すなわちGG/CGCGCC、NotI部位すなわちGC/GGCCGC、PacI部位すなわちTTAAT/TAA、PmeI部位すなわちGTTT/AAAC、SrfI部位すなわちGCCC/GGGC、Sse838I部位すなわちCCTGCA/GG、ならびにSwaI部位すなわちATTT/AAAT)、さらに好ましくは、9ヌクレオチド配列から成るもの、さらに好ましくは、少なくとも10ヌクレオチド配列から成るもの(例えば、BspGI部位すなわちCG/CGCTGGAC)が含まれる。さらに、いくつかの制限部位(例えば、クラスIIS酵素)は、特異性が比較的高い部分(すなわち、制限部位の発生頻度の主な決定因子を含む部分)と、特異性が比較的低い部分とから構成されること、また、切断部位は、特異性が比較的低い部分に含まれる、もしくは含まれないことが考えられる。例えば、Eco57I部位すなわちCTGAAG(16/14)には、特異性が比較的高い部分(すなわち、CTGAAG部分)と、切断部位を含む特異性が比較的低い部分(すなわち、N16配列)がある。
【0402】
本発明の別の好ましい態様では、有用な末端選択標識は、特異的ポリヌクレオチド配列を認識するポリヌクレオチド作用酵素により認識される末端配列である。本発明の好ましい形態では、有用な末端選択標識は、従来のII型制限酵素に加えて、他の酵素も含む。この本発明の好ましい形態によれば、有用なポリヌクレオチド作用酵素には、ジャイレース、ヘリカーゼ、リコンビナーゼ、レラクサーゼ、ならびに、これらに近縁の酵素が含まれる。
【0403】
好ましい例としては、中でも、トポイソメラーゼ(一部が、ジャイレースのサブセットとして類別される)、ならびに、ポリヌクレオチド切断活性(好ましくは、ポリヌクレオチドニッキング活性を含む)および/またはポリヌクレオチド連結活性を有するその他のあらゆる酵素が挙げられる。好ましいトポイソメラーゼ酵素としては、特に、市販の入手源(Epicentre Technologies、ウィスコンシン州マジソン;Invitrogen、カリフォルニア州カールスバート;Life Technologies、メリーランド州ガテスバーク)から、また恐らく、個人的採取源からも、入手可能なトポイソメラーゼI酵素が挙げられる。本書に記載した末端選択に有用な類似酵素が、将来開発されることも考えられる。特に好ましいトポイソメラーゼI酵素は、ワクシニアウイルスを起原とするトポイソメラーゼI酵素であり、これは、特異的認識配列(例えば、5’...AAGGG...3’)を有し、ポリヌクレオチドニッキング活性とポリヌクレオチド連結活性の両方を備えている。この酵素の特異的ニッキング活性(一方の鎖の切断)により、内部認識部位は、切断された末端部位の変性を起こす温度では、ニッキング活性によって起こるポリヌクレオチド破壊を被りにくい(むしろ、アニーリングされた状態を保つ)。従って、末端切断に使用する際、トポイソメラーゼに基づく末端選択のためのニッキング部位は、末端から100ヌクレオチド以下、さらに好ましくは、末端から50ヌクレオチド以下、さらに好ましくは、末端から25ヌクレオチド以下、さらに好ましくは、末端から20ヌクレオチド以下、さらに好ましくは、末端から15ヌクレオチド以下、さらに好ましくは、末端から10ヌクレオチド以下、さらに好ましくは、末端から8ヌクレオチド以下、さらに好ましくは、末端から6ヌクレオチド以下、さらに好ましくは、末端から4ヌクレオチド以下であるのが好ましい。
【0404】
非制限的で、あくまで例示のための特に好ましい態様では、トポイソメラーゼに基づく末端選択用のニッキング部位が、末端から4ヌクレオチドの時、ニッキングにより、4塩基(末端領域で)の一本鎖オリゴを生成するが、このオリゴは、末端選択可能ポリヌクレオチドにおけるその相補鎖から変性することができる。これによって、続く連結反応に有用なポリヌクレオチドの付着末端(4塩基から成る)が形成される。クローニングベクター(好ましくは、発現ベクター)との連結反応を達成するため、制限酵素に基づく手段等のいずれかの手段により、クローニングベクターに、適合付着末端を生成することができる。末端選択可能ポリヌクレオチド末端における末端ヌクレオチド(この具体例では、4末端塩基から成る)を賢明に選択することによって、ポリヌクレオチドを連結しようとするクローニングベクターに生成された付着末端に、適合性を付与することができる。
【0405】
これに対し、例えば、末端から500塩基の、末端選択可能ポリヌクレオチドの内部ニッキングは、500塩基の一本鎖オリゴを生成し、このオリゴは、その相補鎖から容易に変性されないが、むしろ修復に有用である(例えば、ニックを発生する同じトポイソメラーゼ酵素)。
【0406】
従って、本発明は、実施するポリヌクレオチドニッキング付着末端を生成するための−例えば、ワクシニアトポイソメラーゼに基づく、および/またはII(もしくはIIS)型制限エンドヌクレアーゼに基づく、および/または、III型制限エンドヌクレアーゼに基づく、および/またはニッキング酵素に基づく(例えば、N.BstNBIを用いて)−方法であって、上記末端は連結適合性であり、少なくとも1塩基オーバーハングから成る方法を提供する。好ましくは、このような付着末端は、少なくとも2塩基オーバーハングから成り、さらに好ましくは、この付着末端は、少なくとも3塩基オーバーハングから成り、さらに好ましくは、この付着末端は、少なくとも4塩基オーバーハングから成り、さらに好ましくは、この付着末端は、少なくとも5塩基オーバーハングから成り、さらに好ましくは、この付着末端は、少なくとも6塩基オーバーハングから成る。また、上記付着末端は、少なくとも7塩基オーバーハング、または、少なくとも8塩基オーバーハング、または、少なくとも9塩基オーバーハング、または、少なくとも10塩基オーバーハング、または、少なくとも15塩基オーバーハング、または、少なくとも20塩基オーバーハング、または、少なくとも25塩基オーバーハング、または、少なくとも30塩基オーバーハングから成るものでもよい。これらのオーバーハングは、A、C、GまたはTを含むいずれの塩基から構成されてもよい。
【0407】
トポイソメラーゼまたはニッキング酵素(例えば、N.BstNBIを用いて)を用いて導入した付着末端オーバーハングは、連結反応環境に独特の設計とし、自己二量体化およびその他不必要な鎖状体化等、不要なフラグメントの再集合を防止することができる。
【0408】
本発明のある形態によれば、ポリメラーゼに基づく反応の使用により、末端選択可能ポリヌクレオチドの末端領域に、複数の配列(オーバーラップしてもよいが、必ずしもオーバーラップする必要はない)を導入することができる。該当するが、決して制限的ではない例では、このようなオリゴを用いて、トポイソメラーゼIに基づく末端選択に有用な好ましい5’末端領域を達成することができる。このオリゴは、付着末端に変換可能な(好ましくは、ワクシニアトポイソメラーゼIにより)1〜10塩基配列、リボソーム結合部位(すなわち、「RBS」で、好ましくは、発現クローニングに有用なもの)、ならびに、任意のリンカー配列と、これに続くATG出発部位および0〜100塩基の鋳型特異的配列(ポリメラーゼに基づく反応での鋳型へのアニーリングを促進するため)から構成される。従って、この態様によれば、有用なオリゴ(フォワードプライマーと呼ばれる)は、次の配列を有する:5’[末端配列=(N)1−10][トポイソメラーゼI部位およびRBS=AAGGGAGGAG][リンカー=(N)1−100][出発コドンおよび鋳型特異的配列=ATG(N)0−100]3’。
【0409】
同様に、該当するが、決して制限的ではない例では、オリゴを用いて、トポイソメラーゼIに基づく末端選択に有用な好ましい3’末端領域を達成することができる。このオリゴは、付着末端に変換可能な(好ましくは、ワクシニアトポイソメラーゼIにより)1〜10塩基配列、ならびに、任意のリンカー配列と、これに続く0〜100塩基の鋳型特異的配列(ポリメラーゼに基づく反応での鋳型へのアニーリングを促進するため)から構成される。従って、この態様によれば、有用なオリゴ(リバースプライマーと呼ばれる)は、次の配列を有する:5’[末端配列=(N)1−10][トポイソメラーゼI部位=AAGGG][リンカー=(N)1−100][鋳型特異的配列=ATG(N)0−100]3’。
【0410】
末端選択を用いて、子孫分子(例えば、突然変異誘発により生成されたもの)から、親鋳型分子(例えば、突然変異誘発を実施すべきもの)を識別および分離することができる。例えば、トポイソメラーゼI認識部位がないプライマーの第1セットを用いて、親分子の末端領域(例えば、ポリメラーゼに基づく増幅)を修飾することができる。その後、上記とは別の第2セットのプライマー(例えば、トポイソメラーゼI認識部位を有する)を用いて、増幅した鋳型分子から、突然変異させた子孫分子を生成することができる(例えば、合成の中断、鋳型スイッチングポリメラーゼに基づく増幅、または合成の中断等のポリヌクレオチドキメラ化方法;または、飽和突然変異誘発;あるいは、本書に記載したように、トポイソメラーゼI認識分子を、突然変異誘発させた子孫分子に導入するその他のいずれかの方法を用いて)。次に、トポイソメラーゼIに基づく末端選択を使用して、識別だけではなく、所望の子孫分子の、選択的トポイソメラーゼIに基づく連結反応を促進することができる。
【0411】
従って、増幅した親分子に対する第2組のプライマーのアニーリングは、第1組のプライマー(すなわち、一組の親部位を増幅するのに使用されるプライマー)に、トポイソメラーゼI認識部位に類似しているが、機能トポイソメラーゼI酵素の認識を阻害するのに十分異なる配列を組み込むことにより促進することができる。例えば、AAGGG部位のいずれかの1塩基〜全5塩基を変えた配列を第1セットのプライマー(突然変異誘発に付す前に、親鋳型の増幅に使用するもの)に組み込むことができる。具体的かつ非制限的形態では、親分子は、例として以下に示すが、決して制限的ではない組のフォワードおよびリバースプライマーを用いて増幅することができる。
【0412】
フォワードプライマー:5’CTAGAAGAGAGGAGAAAACCATG(N)10−1003’、および
リバースプライマー:5’GATCAAAGGCGCGCCTGCAGG(N)10−1003’
第1組のプライマーの上記例によれば、(N)10−100は、好ましくは10〜100ヌクレオチド長さの鋳型特異的配列、さらに好ましくは、10〜50ヌクレオチド長さの鋳型特異的配列、さらに好ましくは、10〜30ヌクレオチド長さの鋳型特異的配列、さらに好ましくは、15〜25ヌクレオチド長さの鋳型特異的配列を示す。
【0413】
具体的かつ非制限的形態によれば、この増幅(真のトポイソメラーゼI認識部位が欠如した上記第1セットのプライマーを用いて)の後、増幅した親分子を、真のトポイソメラーゼI認識部位を有する1セット以上のフォワードおよびリバースプライマーを用いて、突然変異誘発にかけることを特徴とする。従って、具体的かつ非制限的形態では、例として以下に示すが、決して制限的ではない第2組の前進およびリバースプライマーを用いて、親分子を、突然変異誘発した子孫分子を生成するための鋳型として使用することを特徴とする。
【0414】
フォワードプライマー:5’CTAGAAGGGAGGAGAAAACCATG3’
リバースプライマー:5’GATCAAAGGCGCGCCTGCAGG3’(AscI認識部位配列を含む)
本発明に従う末端選択用の第1、第2、あるいは、これに続くセットのプライマーとして、特に記載していない異なるプライマーを何セットでも使用することも可能である。II型制限酵素部位を組み込んでもよいことに留意すべきである(例えば、前述の例にAscI部位)。また、実施ポリヌクレオチドを飽和突然変異誘発に付すために、実験者は、記載した他の配列以外にも、一つ以上のN、N、G/Tトリプレットを有用なプライマーに組み込むことができる。すなわち、第2セットおよび/または続くセットのプライマーを使用することにより、トポイソメラーゼI部位の導入と、子孫ポリヌクレオチドにおける突然変異の誘発という二つの目的を達成することができる。
【0415】
従って、提供される一態様によれば、有用な末端選択標識とは酵素認識部位であり、この部位が、酵素に、指定部位でポリヌクレオチドを切断(ニックを含む)させ、生成された一本鎖オリゴが変性すると同時に、連結反応適合末端を形成する。次に、形成されたポリヌクレオチド末端の連結反応を、同じ酵素(例えば、ワクシニアウイルスの場合には、トポイソメラーゼI)、あるいは別の酵素を使用して達成することができる。本発明のある形態によれば、ポリヌクレオチドを選択するために、同種(例えば、二つのワクシニアウイルストポイソメラーゼI認識部位)または異種(例えばクラスII制限酵素認識部位およびワクシニアウイルストポイソメラーゼI認識部位)に拘わらず、あらゆる末端選択標識を組み合わせて用いることが可能である。従って、各選択可能ポリヌクレオチドは、1種以上の末端選択標識を有し、これら標識は、同種または異種末端選択標識のいずれでもよい。具体例では、複数の末端選択標識をポリヌクレオチドの一方の末端に位置させ、互いにオーバーラップ配列を持つようにすることができる。
【0416】
本発明に従う末端選択では、現在存在するか、将来開発されるかに拘わらず、何種類の酵素でも有用であることに特に留意すべきである。例えば、本発明の具体的態様では、末端選択を達成するために、ポリヌクレオチド連結活性源と共に、ニッキング酵素(例えば、5’...GAGTCNNNN/N...3’で、一方の鎖だけを切断するN.BstNBI)を用いることができる。この態様によれば、N.BstNBIの認識部位(トポイソメラーゼIの認識部位ではなく)は、末端選択可能ポリヌクレオチドに組み込まなければならない(突然変異を誘発させた子孫分子の選択に末端選択を用いるかどうか、もしくは、突然変異誘発手順とは別に末端選択を用いるかどうかに拘わらず)。
【0417】
トポイソメラーゼに基づくニッキングおよび連結反応を用いたこの末端選択手法は、従来の選択方法に対して、いくつかの利点を有する。すなわち、この手法は、指向性クローニング(発現クローニングを含む)の達成を可能にする。特に、この手法を用いて、下記事項を達成することができる:直接連結反応(すなわち、伝統的な制限−精製−連結反応に付す必要がない。これは、開始制限反応から、T4DNAリガーゼの使用に依存する連結反応まで、多く問題を被りやすい);元の鋳型分子(例えば、トポイソメラーゼI部位が欠如した元の鋳型分子であり、該部位は、突然変異誘発後まで、導入されない)からの子孫分子の分離;サイズ分離段階(例えば、ゲルクロマトグラフィーまたはその他の電気泳動手段、あるいは、サイズ排除膜の使用により)の必要がなくなる;内部配列の保存(トポイソメラーゼIが存在する場合でも);連結反応(例えば、特に、不要な残留制限酵素活性の存在下で、T4DNAリガーゼの使用に依存した)がうまくいかない心配が不要になる;ならびに発現クローニングの促進(フレームシフトの心配がなくなる等)。また、トポイソメラーゼに基づくニッキングおよび連結反応を用いた上記末端選択法により、不要な制限酵素に基づく切断についての心配−特に、実施するポリヌクレオチドの内部制限部位での(あるいは、不要なスター活性のしばしば予測不可能な部位でも)−もなくすことができる。この切断は、実施ポリヌクレオチドの破壊部位となる恐れがある。
【0418】
2−ハイブリッドに基づくスクリーニング検定
また、シャッフリングを用いて、2−ハイブリッドスクリーニング系をスクリーニングすることにより得られた選択ライブラリーメンバーのプールを組換えにより多様化して、予め決められたポリペプチド配列に結合するライブラリーメンバーを同定することができる。選択したライブラリーメンバーをプールし、in vitroおよび/またはin vivo組換えによりシャッフリングする。次に、シャッフリングしたプールを、酵母2−ハイブリッド系でスクリーニングして、上記の予め決定されたポリペプチド配列(例えば、SH2ドメイン)、もしくは、代わりの予め決められたポリペプチド配列(例えば、別のタンパク質種由来のSH2ドメイン)に結合するライブラリーメンバーを選択することができる。
【0419】
予め決められたポリペプチド配列に結合するポリペプチド配列を同定する手法は、予め決められたポリペプチド配列が融合タンパク質に存在するいわゆる「2−ハイブリッド」系を使用することであった(Chienら、1991)。この手法は、転写活性化因子(FieldsおよびSongら、1989)、すなわち酵母Ga14転写タンパク質の再構成を通して、in vivoでタンパク質−タンパク質相互作用を同定する。この方法は、典型的に、酵母Ga14タンパク質の性質に基づくものである。該タンパク質は、DNA結合および転写活性化を担う分離可能なドメインから成る。二つのハイブリッドタンパク質(一つは、既知のタンパク質のポリペプチド配列に融合した酵母Ga14DNA結合ドメインから成り、他方は、第2タンパク質のポリペプチド配列に融合したGa14活性化ドメインから成る)をコードするポリヌクレオチドを作製し、酵母宿主細胞に導入する。二つの融合タンパク質同士の分子間結合により、Ga14活性化ドメインを有するGa14結合ドメインが再構成され、これによって、Ga14DNA結合部位に操作可能に結合されたレポーター遺伝子(例えば、lacz、HIS3)の転写活性化が起こる。典型的に、2−ハイブリッド法を用いて、既知のタンパク質と相互作用する新規のポリペプチド配列を同定する(SilverおよびHunt、1993;Durfeeら、1993;Yangら、1992;Lubanら、1993;Hardyら、1992;Bartelら、1993;ならびにVojtekら、1993)。しかし、第2の既知タンパク質に対する結合に影響する既知タンパク質の突然変異を同定するのに、2−ハイブリッド法の変形例が用いられている(LiおよびFields、1993;Laloら、1993;Jacksonら、1993;ならびにMaduraら、1993)。また、2−ハイブリッド系は、二つの公知のタンパク質の相互作用構造ドメインの同定(Bardwellら、1993;Chakrabartyら、1992:Staudingerら、1993;ならびにMilneおよびWeaver1993);あるいは、単一タンパク質のオリゴマー化の原因であるドメインの同定(Iwabuchiら、1993;Bogerdら、1993)にも使用されている。タンパク質分解酵素のin vivo活性の研究に、2−ハイブリッド系の変形が使用されている(Dasmahapatraら、1992)。あるいは、大腸菌(E.coli)/BCCP相互作用スクリーニング系(Germinoら、1992;Guarente、1993)を用いて、相互作用タンパク質配列(すなわち、ヘテロ二量体化する、もしくは、さらに高次のヘテロ多量体を形成するタンパク質配列)を同定することもできる。2−ハイブリッド系により選択した配列をプールし、シャッフリングした後、2−ハイブリッド系に導入して、1ラウンド以上の更なるスクリーニングに供し、予め決めた結合配列を含むハイブリッドに結合するポリペプチドハイブリッドを同定することも可能である。このようにして同定した配列を比較して、共通配列および共通配列の核(kernal)を同定する。
【0420】
一般に、組換えDNA技術の標準的方法は、様々な文献に記載されている(例えば、Sambrookら、1989;Ausubelら、1987;ならびにBergerおよびKimmel、1987;いずれも参照として全文を本書に組み込む)。ポリヌクレオチドを修飾する酵素は、製造者の推奨事項に従って使用した。ABI化学薬品を用いて、Applied Biosystems Inc.の394型DNA合成装置で、オリゴヌクレオチドを合成した。所望であれば、予め決めたDNA配列を増幅するために、実験者の判断で、PCR増幅装置を選択してもよい。
【0421】
1マイクログラムの鋳型DNAのサンプルを採取し、UV光線で処理することにより、TT二量体、特にプリン二量体等を作製する。UV暴露は、鋳型DNAサンプルの遺伝子毎に、わずかな光産物しか生成されないように、制限する。時間を変えながら、複数のサンプルをUV光線で処理し、UV暴露による可変数の二量体を有する鋳型DNAサンプルを作製する。
【0422】
非校正ポリメラーゼ(例えば、Stratagene Cloning Systems製のPrime−ItIIランダムプライマーラベリングキット)を用いたランダムプライミングキットを使用して、UV光線で作製した(上記の通り)鋳型のランダム部位でプライミングし、鋳型に沿って伸長させることにより、様々なサイズのポリヌクレオチドを生成する。プライマーの伸長には、上記のようなPrime−ItIIランダムプライマーラベリングキット等のプライミングプロトコルを使用してよい。UV暴露により作製した二量体は、非校正ポリメラーゼによる伸長のためのロードブロックとして役立つ。従って、ランダムプライマーによる伸長が完了すると、ランダムなサイズのポリヌクレオチドのプールが存在する。
【0423】
本発明はさらに、典型的には、増幅および/またはクローニングしたポリヌクレオチドの形態の、選択された突然変異体ポリヌクレオチド配列(もしくは、選択されたポリヌクレオチド配列の集団)を生成し、これにより、選択されたポリヌクレオチド配列が、選択することができる少なくとも一つの所望の表現型特徴(例えば、ポリペプチドをコードする、結合したポリヌクレオチドの転写を促進する、タンパク質を結合する等)を有することを特徴とする方法に関する。予め決めた生物学的高分子(例えば、受容体)への結合等、所望の構造または機能的性質を有するハイブリッドポリペプチドを同定する一つの方法は、ポリペプチドのアミノ酸配列が賦与した所望の構造または機能的性質を有する個別のライブラリーメンバーについて、ポリペプチドの大きなライブラリーをスクリーニングすることを包含する。
【0424】
ある態様では、本発明は、親和性相互作用スクリーニングまたは表現型スクリーニングに適した展示ポリペプチドもしくは展示抗体のライブラリーを生成する方法を提供する。この方法は、(1) 展示ポリペプチドまたは展示抗体と、該展示ポリペプチドまたは展示抗体をコードする会合ポリヌクレオチドとを含む選択されたライブラリーメンバーの第1集団を作製し、上記会合ポリヌクレオチドが、ほぼ同じ配列の領域を含む上記会合ポリヌクレオチドまたはそのコピーを作製し、上記ポリヌクレオチドまたはコピーに突然変異を最適に導入し、(2) ポリヌクレオチドまたはコピーをプールし、(3) ランダムまたは特殊化プライミングおよび合成方法もしくは増幅方法を中断することにより、さらに小さいもしくは短いポリヌクレオチドを生成し、(4) 増幅、好ましくはPCR増幅、ならびに、任意で突然変異誘発を実施することにより、新たに合成したポリヌクレオチドを相同的に組換えることから成る。
【0425】
本発明の特に好ましい目的は、下記を含む一連のステップにより有用なハイブリッドポリペプチドを発現するハイブリッドポリヌクレオチドを生成する方法を提供することである:
(a) 増幅または合成を停止または中断する手段を用いて、ポリヌクレオチド増幅もしくは合成工程を中断することにより、ポリヌクレオチドを生成し、これによって、ポリヌクレオチドの複製が様々な完了段階にあるために、小さいまたは短い複数のポリヌクレオチドを作製し;
(b) 得られた一本鎖または二本鎖ポリヌクレオチドの集団に、1つ以上の一本鎖または二本鎖オリゴヌクレオチドを付加するが、このとき、該付加オリゴヌクレオチドは、上記集団の1つ以上の一本鎖または二本鎖ポリヌクレオチドに対する異種性領域に同一領域を含み;
(c) 得られた一本鎖または二本鎖オリゴヌクレオチドを変性して、一本鎖ポリヌクレオチドの混合物を生成し、任意で、小さい、または短いポリヌクレオチドを、様々な長さを有するポリヌクレオチドのプール中に分離し、さらに任意で、該ポリヌクレオチドをPCR工程に付して、上記ポリヌクレオチドプールの少なくとも1つに含まれる1つ以上のオリゴヌクレオチドを増幅し;
(d) 複数の上記ポリヌクレオチド、または、上記ポリヌクレオチドの少なくとも1つのプールをポリメラーゼとインキュベートするが、その際の条件を、一本鎖ポリヌクレオチド間の同一領域で、上記一本鎖ポリヌクレオチドのアニーリングが起こり、これによって、突然変異を誘発した二本鎖ポリヌクレオチド鎖が形成されるようなものとし;
(e) 任意で、上記ステップ(c)および(d)を繰り返し;
(f) 上記ポリヌクレオチド鎖から少なくとも一つのハイブリッドポリペプチドを発現させ;
(g) 有用な活性について、少なくとも一つのハイブリッドポリペプチドをスクリーニングする。
【0426】
本発明の好ましい態様では、増幅または合成工程を停止または中断する手段は、UV光線、DNA付加物、DNA結合タンパク質の使用によるものである。
【0427】
本発明のある態様では、DNA付加物、もしくはDNA付加物を含むポリヌクレオチドは、更なる処理の前に、DNAフラグメントを含有する溶液を加熱する工程を包含する方法等により、ポリヌクレオチドまたはポリヌクレオチドプールから除去する。
【0428】
以上、本発明の例示的態様を開示してきたが、これらの態様は例示のために過ぎず、他の代替案、調整および変更を本発明の範囲内で実施できることに留意すべきである。従って、本発明は、本書に示した具体的態様に制限されない。
【0429】
これ以上詳述することなく、これまでの説明に従い、当業者が、本発明をその完全な範囲まで利用できると思われる。以下に示す実施例は、例示として考えるべきであり、これら以外の開示を何ら制限するものではない。
【0430】
実施例1
UV誘発光化学生成物を用いたランダムサイズポリヌクレオチドの生成
1マイクログラムの鋳型DNAサンプルを採取し、UV光で処理することにより、TT二量体、特にプリン二量体等の二量体を形成させる。UV暴露は、鋳型DNAサンプルの遺伝子毎に生成される光化学生成物がごく少数であるように、制限する。複数のサンプルを時間を変えながらUVで処理し、UV暴露から可変数の二量体を有する鋳型DNAサンプルを得る。
【0431】
非校正ポリメラーゼ(例えば、Stratagene Cloning Systems製のPrime−ItIIランダムプライマーラベリングキット)を用いたランダムプライミングキットを使用して、UVで作製した(上記の通り)鋳型のランダム部位でプライミングし、鋳型に沿って伸長することにより、様々なサイズのポリヌクレオチドを生成する。プライマーの伸長には、上記のようなPrime−ItIIランダムプライマーラベリングキット等のプライミングプロトコルを使用してよい。UV暴露により作製した二量体は、非校正ポリメラーゼによる伸長のための障害物(roadblock)として働く。従って、ランダムプライマーによる伸長が終了すると、ランダムサイズのポリヌクレオチドのプールが存在する。
【0432】
実施例2
ランダムサイズポリヌクレオチドの単離
実施例1で作製した目的のポリヌクレオチドを、1.5%アガロースゲルでゲル単離する。100〜300bpレンジのポリヌクレオチドをゲルから切り抜き、3容量の6M NaIをこのゲルスライスに添加する。混合物を10分間50℃でインキュベートし、10μlのガラスミルク(Bio 101)を添加する。混合物を1分間回転させ、上澄みを傾捨する。このペレットを500μlのカラムウォッシュ(カラムウォッシュは、50%エタノール、10mM Tris−HCl pH7.5、100mM NaClおよび2.5mM EDTA)で洗浄し、1分間回転させた後、上澄みを傾捨する。次に、洗浄、回転および傾捨を繰り返す。ガラスミルク(glass milk)ペレットを20μlのHOに再懸濁し、1分間回転させる。DNAを水相に維持する。
【0433】
実施例3
単離したランダムサイズ 100 300bp ポリヌクレオチドのシャッフリング
実施例2で作製した100〜300bpポリヌクレオチドを、プライマーを添加せずに、アニーリング混合物(0.2mMの各dNTP、2.2mM MgCl、50mM KCl、10mM Tris−HCl pH8.8、0.1% Triton X−100、0.3μ;TaqDNAポリメラーゼ、全量50μl)中で再結合させた。アニーリングステップは、Stratagene製のRobocyclerを用い、次の手順で実施した:30秒間95℃、25〜50サイクルの[30秒間95℃、30秒間50〜60℃(好ましくは58℃)、および30秒間72℃]、ならびに、5分間72℃。このようにして、100〜300bpポリヌクレオチドが結合し、これまでより長い配列の二本鎖ポリヌクレオチドが得られた。再集合二本鎖ポリヌクレオチドを分離し、これらを変性して、一本鎖ポリヌクレオチドを形成した後、任意で、鋳型としての一本鎖とプライマーを用いたサンプル、ならびに、一本鎖に加えてランダムプライマーDNAを用い、別のサンプルで、サイクルを繰り返す。
【0434】
実施例4
シャッフリングしたポリヌクレオチドのスクリーニング
実施例3のポリヌクレオチドを分離し、そこからポリペプチドを発現させる。元の鋳型DNAを、そこから比較ポリペプチドを作製することにより、比較対照として用いる。実施例3のシャッフリング済ポリペプチドから得られたポリペプチドを、元の鋳型から得られたポリペプチドの活性についてスクリーニングし、対照の活性レベルと比較する。スクリーニング中に発見した目的のポリペプチドをコードするシャッフリング済ポリヌクレオチドを、望ましい二次性質について比較する。目的のものとは異なるスクリーニングされたポリペプチドに対応するシャッフリングされたポリヌクレオチドを再シャッフリングに付す。
【0435】
実施例5
飽和突然変異誘発による酵素の定方向進化
部位飽和突然変異誘発:部位飽和突然変異を達成するために、下記のように、32倍縮重オリゴヌクレオチドプライマーを用いた部位定方向突然変異により、デハロゲナーゼ酵素の各残基(316)を全20個のアミノ酸に変換した。
【0436】
1.デハロゲナーゼ発現構築物の培養物を培養し、プラスミドの調製を行った。
【0437】
2.各コドンをランダム化させるためのプライマーを作製した。これらは、共通の構造:X20NN(G/T)X20を有する。
【0438】
3.約50ngのプラスミド鋳型、125ngの各プライマー、1×ネイティブPfuバッファー、200μMの各dNTP、ならびに2.5UネイティブPfuDNAポリメラーゼを含む25μlの反応混合物を調製した。
【0439】
4.Robo96 Gradient Cyclerで、以下のようなサイクル反応を行った:
1分間95℃で初期変性、
45秒間95℃、1分間53℃、11分間72℃のサイクルを20回
10分間、72℃で最終伸長ステップ。
【0440】
5.10UのDpnIを用いて、37℃で1時間反応混合物を消化させて、メチル化鋳型DNAを消化した。
【0441】
6.2ulの反応混合物を用いて、50ulのXL1−BlueMRF’細胞を形質転換し、全形質転換ミックスを大型のLB−Amp−Metプレート上に平板培養し、200〜1000のコロニーを取得した。
【0442】
7.LB−Amp−IPTGを含有する96ウェルマイクロプレートのウェルに、個々のコロニーをツマヨウジで移し、一晩増殖させた。
【0443】
8.これらプレート上のクローンを翌日検定した。
【0444】
スクリーニング:下記のように、各位置について突然変異体の約200クローンを液体培地(384ウエルマイクロプレート)で増殖し、スクリーニングした。
【0445】
1.384ウェルプレートに一晩放置した培養物を遠心分離にかけ、培地を除去した。各ウェルに、0.06mL 1mM Tris/SO 2− pH7.8を添加した。
【0446】
2.0.02mL細胞懸濁液から成る各親培養プレートから2つの検定プレートを作製した。
【0447】
3.所定時間(初め30分間)、一方の検定プレートを室温に、他方は、上昇させた温度(初期スクリーニングでは55℃)に置いた。
【0448】
4.規定時間後、0.08mL室温基質(1.5mM NaNおよび0.1mMブロモチモールブルーを含むTCP飽和1mM Tris/SO 2− pH7.8)を各ウェルに添加した。
【0449】
5.各時点で、620nmでの測定を実施し、各ウェルについてプログレス曲線を作成した。
【0450】
6.データを分析し、非加熱のものと、加熱細胞の速度論を比較した。各プレートには、1〜2カラム(24ウェル)の突然変異していない20F12対照を含有させた。
【0451】
7.安定性が向上したと思われるウェルを再培養した後、同じ条件下で試験した。
【0452】
この手順によれば、9つの単一部位突然変異が、酵素に対して増大した熱安定性を賦与していることがわかった。配列分析を実施して、具体的に改良の原因となった各位置での厳密なアミノ酸変化を測定した。すなわち、改良は、7つの部位では一つのアミノ酸変化だけにより、8番部位では2つのアミノ酸変化の各々により、9番部位では3つのアミノ酸変化の各々により賦与されていた。次に、各々が、これら9つの有利な部位突然変化のうちの複数を併せ持つ突然変異体をいくつか作製した。そのうちの二つの突然変異体が、単一点突然変異を含む他の突然変異体すべてと比較して優れていることがわかった。
【0453】
実施例6
末端選択を用いた直接発現
5’ホスホリル化プライマーを用いて、標準PCR反応で、エステラーゼ遺伝子を増幅した(10ng鋳型;PCR条件:3分間94℃;[1分間94℃;1分間50℃;1分間30秒68℃]×30;10分間68℃)。
【0454】
順方向プライマー=9511TopF
(CTAGAAGGGAGGAGAATTACATGAAGCGGCTTTTAGCCC)
逆方向プライマー=9511TopR(AGCTAAGGGTCAAGGCCGCACCCGAGG)
得られたPCR産物(約1000bp)を、ゲル精製および定量化した。
【0455】
発現クローニングのためのベクター、pASK3(Institut fuer Bioanalytik、Goettingen、ドイツ)をXba IおよびBgl IIで切断し、CIPで脱リン酸した。
【0456】
0.5pモルのVaccina Topoisomerase I(Invitrogen、カリフォルニア州カールスバード)を、全量5μlのバッファーNEBI(NewEngland Biolabs、マサチューセッツ州ベバーリー)中で、5分間37℃、60ng(約0.1pmole)精製PCR産物に添加した。
【0457】
トポゲートした(topogated)PCR産物を、室温で5分間、ベクターpASK3(NEBI中の5μl、約200ng)中にクローニングした。
【0458】
混合物をHOに対し30分間透析した。
【0459】
2μlを用いて、DH10B細胞の電気穿孔を実施した(Gibco BRL、メリーランド州Geithersburg)。
【0460】
効率:実際のクローンの数によれば、この方法は、μgベクター当たり2×10クローンを産生することができる。試験した組換え体はすべて、アンヒドロテトラサイクリンによる誘発の後、エステラーゼ活性を示した。
【0461】
実施例7
デハロゲナーゼ熱安定性
本発明は、定方向進化により生成される望ましい性質が、苛酷な環境と考えられるもの等の、変化させた環境に特定時間供した後、分子の改良された残存活性(例えば、酵素活性、免疫反応性、抗生物質活性等)により、制限的に実現されることを特徴とする。このような苛酷な環境には、下記のいずれかの組合せを含むことができる(反復または反復しなくても、どんな順序もしくは順列でもよい):温度上昇(実施酵素の変性を起こし得る温度を含む)、温度低下、塩濃度上昇、塩濃度低下、pH上昇、pH低下、圧力上昇、圧力低下、ならびに放射線源暴露の変化(紫外線、可視光線、ならびに、全電磁スペクトルを含む)。
【0462】
以下の実施例は、上昇させた温度に暴露後に、酵素が活性を回復および/または保持する能力を進化させるための、定方向進化の使用を示す。
【0463】
デハロゲナーゼ酵素の各残基(316)を、32倍縮重オリゴヌクレオチドプライマーを用いて部位特異的突然変異により全20アミノ酸に変換した。これら突然変異を、すでに速度改善した変異体Dhla20F12に導入した。各位置の約200のクローンを液体培地(384ウェルマイクロプレート)で培養し、スクリーニングした。
【0464】
スクリーニング手順は、次の通りである:
1.384ウェルプレートに一晩放置した培養物を遠心分離にかけ、培地を除去した。各ウェルに、0.06mL 1mM Tris/SO 2− pH7.8を添加した。
【0465】
2.0.02mL細胞懸濁液から成る各親培養プレートから2つの検定プレートをロボットにより作製した。
【0466】
3.所定時間(初め30分間)、一方の検定プレートを室温に、他方は、上昇させた温度(初期スクリーニングでは55℃)に置いた。
【0467】
4.規定時間後、0.08mL室温基質(1.5mM NaNおよび0.1mMブロモチモールブルーを含むTCP飽和1mM Tris/SO 2− pH7.8)を各ウェルに添加した。TCP=トリクロロプロパン。
【0468】
5.各時点で、620nmでの測定を実施し、各ウェルについてプログレス曲線を作成した。
【0469】
6.データを分析し、非加熱のものと、加熱細胞の速度論を比較した。各プレートには、1〜2カラム(24ウェル)の突然変異していない20F12対照を含有させた。
【0470】
7.安定性が向上したと思われるウェルを再培養した後、同じ条件下で試験した。
【0471】
この手順によれば、9つの単一部位突然変異が、Dhla−20F12に対して増大した熱安定性を賦与することがわかった。配列分析から、次の変化が有利であることが明らかになった。
【0472】
D89G
F91S
T159L
G189Q、G189V
I220L
N238T
W251Y
P302A、P302L、P302S、P302K
P302R/S306R
二つの部位(189および302)だけが、一つ以上の置換を有した。上記リストの最初の5つは、単一遺伝子(この突然変異体は、「Dhla5」と呼ぶ)に(G189Qを用いて)統合された。S306Rを除くすべての変化は、Dhla8と呼ばれる別の変異体に組み込まれた。
【0473】
熱安定性は、所定時間、上昇させた温度(55℃および80℃)で酵素をインキュベートすることにより評価し、活性検定を30℃で実施した。高い方の温度で、初期速度を、時間毎に記録した。酵素は、インキュベーションおよび検定の両方で、50mM Tris/SO 2− pH7.8に含有させた。Fe(NOおよびHgSCNを用いた標準方法により産物(Cl)を検出した。de facto野生型としてDhla20F12を用いた。指数的崩壊関数にデータを当てはめることにより、見掛け半減期(T1/2)を計算した。
【0474】
これらの結果は図1に示す。
【0475】
参考文献
特に指摘しない限り、本明細書に記載された全ての文献(上記および下記の)は、その全体が参照により本明細書に組み入れられるものとする。
【0476】
Barret AJら(編)、Enzyme Nomenclature: Recommendations of the Nomenclature Committee of the International Union of Biochemistry and Molecular Biology.(「酵素命名法:国際生化学分子生物学連合の命名委員会勧告」)、San Diego: Academic Press, Inc., 1992.
Boyce COL(編)、Novo Handbook of Practical Biotechnology.(「実用バイオテクノロジーに関するノボのハンドブック」)、第2版、Bagsvaerd, Denmark, 1986.
Drauz K, Waldman H(編)、Enzyme Catalysis in Organic Synthesis: Comprehensive Handbook.(「有機合成における酵素触媒:総合ハンドブック」)、第1巻、New York: VCH Publishers, 1995.
Drauz K, Waldman H(編)、Enzyme Catalysis in Organic Synthesis: Comprehensive Handbook.(「有機合成における酵素触媒:総合ハンドブック」)、第2巻、New York: VCH Publishers, 1995.
Foster GD, Taylor SC(編)、Plant Virology Protocols: From Virus Isolation to Transgenic Resistance.(「植物ウイルス学プロトコル:ウイルスの単離からトランスジェニック耐性まで」)、Methods in Molecular Biology、第81巻、New Jersey: Humana Press Inc., 1998.
Franks F(編)、Protein Biotechnology: Isolation, Characterization, and Stabilization. (「タンパク質のバイオテクノロジー:単離、特性評価、および安定化」)、New Jersey: Humana Press Inc., 1993.
Godfrey T, West S(編)、Industrial Enzymology.(「工業酵素学」)、第2版、London: Macmillan Press Ltd, 1996.
Gottschalk G、Bacterial Metabolism.(「細菌代謝」)、第2版、New York: Springer−Verlag Inc., 1986.
Gresshoff PM(編)、Technology Transfer of Plant Biotechnology.(「植物バイオテクノロジーの技術導入」)、Current Topics in Plant Molecular Biology.
Boca Raton: CRC Press, 1997.
Griffin HG, Griffin AM(編)、PCR Technology: Currrent Innovations.(「PCR 技術:最新の考案」)、Boca Raton: CRC Press, Inc., 1994.
Hansen G, Chilton MD、「所与の微生物による植物への遺伝子導入における課題」、Curr Top Microbiol Immunol 240:21−57, 1999.
Hartmann HT(編)、Plant Propagation: Principles and Practices.(「植物の繁殖:原理と実践」)、第6版、New Jersey: Prentice Hall, Inc., 1997.
Perun TJ, Propst CL(編)、Computer−Aided Drug Design: Methods and Applications. (「コンピューターを援用した薬物設計:方法および応用」)、New York: Marcel Dekker, Inc., 1989.
Owen MRL, Pen J、Transgenic Plants: Production System for Industrial and Pharmaceutical Proteins.(「トランスジェニック植物:工業的、製薬学的タンパク質のための生産システム」)、Chichester: John Wiley & Sons, 1996.
Segel IH、Enzyme Kinetics: Behavior and Analysis of Rapid Equilibrium and Steady−State Enzyme Systems.(「酵素反応速度論:酵素系の急速な平衡および定常状態の振る舞いおよび分析」)、New York: John Wiley & Sons, Inc., 1993.
White JS, White DC、Source Book of Enzymes.(「酵素原典」)、Boca Raton: CRC Press, 1997.
Wong CH, Whitesides GM、Enzymes in Synthetic Organic Chemistry.(合成有機化学における酵素」)、第12巻、New York: Elsevier Science Publications, 1995.
WO 97/35966、1997年3月20日出願、1997年10月2日公開、Minshull J, Stemmer WP、「細胞工学および代謝工学のための方法および組成物」
WO 98/31837、1998年1月16日出願、1998年7月23日公開、Delcardayre SB, Tobin MB, Stemmer WP, Minshull, J、「帰納的配列組換えによる全細胞および生物の進化」
WO 98/37223、1998年2月18日出願、1998年8月27日公開、Pang SZ, Gonsalves D, Jan FJ、「植物に複数の形質を付与するためのDNA構築物」
Alting−Mecs MA and Short JM、「ポリコスベクター:λファージパッケージング抽出物を用いた線維状ファージおよびファージミドベクターのパッケージング系」、Gene 137:1, 93−100, 1993.
Arkin APおよびYouvan DC、「タンパク質工学のためのアルゴリズム:帰納的アンサンブル突然変異誘発のシミュレーション」、Proc Natl Acad Sci USA 89(16):7811−7815, (Aug 15) 1992.
Arnold FH、「異常環境のためのタンパク質工学」、Current Opinion in Biotechnology 4(4):450−455, 1993.
Ausubel FMら(編)、Current Protocols in Molecular Biology (「分子生物学の最新プロトコル」)、第1巻および第2巻および補遺、(別名「赤本」)、Greene Publishing Assoc., Brooklyn, NY、(著作権)、1987.
Ausubel FMら(編)、Current Protocols in Molecular Biology (「分子生物学の最新プロトコル」)、第1巻および第2巻および補遺、(別名「赤本」)、Greene Publishing Assoc., Brooklyn, NY、(著作権)、1989.
Ausubel FMら(編)、Short Protocols in Molecular Biology:   Compendium of Methods from Current Protocols in Molecular Biology. (「分子生物学のショートプロトコル:分子生物学の最新プロトコルからの方法の概論」)、Greene Publishing Assoc., Brooklyn, NY、(著作権)、1989.
Ausubel FMら(編)、Short Protocols in Molecular Biology:   Compendium of Methods from Current Protocols in Molecular Biology. (「分子生物学のショートプロトコル:分子生物学の最新プロトコルからの方法の概論」)、第2版、Greene Publishing Assoc., Brooklyn, NY、(著作権)、1992.
Barbas CF 3世, Bain JD, Hoekstra DM, Lerner RA、「半合成コンビナトリアル抗体ライブラリー:多様な問題に対する化学的解決策」、Proc Natl Acad Sci USA 89(10):4457−4461, 1992.
Bardwell AJ, Bardwell L, Johnson DK, Friedberg EC、「酵母のDNA組換えおよび修復タンパク質Rad1およびRad10は、in vivoで局在化疎水性ドメインを介した複合体を構成する」、Mol Microbiol 8(6):1177−1188, 1993.
Bartel P, Chien CT, Sternglanz R, Fields S、「2−ハイブリッド系の使用において生じる偽陽性の消失」、Biotechniques 14(6):920−924, 1993.
Beaudry AAおよびJoyce GF、「RNA酵素の定方向進化」、 Science 257(5070):635−641, 1992.
BergerおよびKimmel、Methods in Enzymology (「酵素学における方法」)、第152巻、「分子クローニング技術へのガイド」、Academic Press, Inc., San Diego, CA、(著作権)、1987. (累積標題索引:第135−139巻、第141−167巻、1990, 第272頁)
Bevan M、「植物の形質転換のためのバイナリーアグロバクテリウムベクター」、Nucleic Acids Research 12(22):8711−21, 1984.
Biocca S, Pierandrei−Amaldi P, Cattaneo A、「抗p21ras単鎖Fvフラグメントの細胞内発現は、アフリカツメガエル卵母細胞の減数***成熟を阻害する」、Biochem Biophys Res Commun 197(2):422−427, 1993.
Birdら、Plant Mol Biol 11:651, 1988..
Bogerd HP, Fridell RA, Blair WS, Cullen BR、「1型および2型ヒト免疫不全ウイルスのTatタンパク質は真核細胞の核において多量体化し得るという遺伝的根拠」、J Virol 67(8):5030−5034, 1993.
Brederode FT, Koper−Zawrthoff EC, Bol JF、「アルファルファモザイクウイルスRNA 4の全ヌクレオチド配列」、Nucleic Acids Research 8(10):2213−23, 1980.
Breitling F, Dubel S, Seehaus T, Klewinghaus I, Little M、「抗体スクリーニングのための表面発現ベクター」、Gene 104(2):147−153, 1991.
Brown NL, Smith M、「Haemophilus gallinarum (Hga I)から単離された制限エンドヌクレアーゼの切断特異性」、Proc Natl Acad Sci U S A 74(8):32l3−6, (Aug) 1977.
Burton DR, Barbas CF 3世, Persson MA, Koenig S, Chanock RM, Lerner RA、「無症状性血清陽性個体のコンビナトリアルライブラリーに由来する1型ヒト免疫不全ウイルスに対するヒトモノクローナル抗体の巨大アレイ」、Proc Natl Acad Sci U S A 88(22):10134−7, (Nov 15) 1991.
Caldwell RCおよびJoyce GF、「PCR突然変異誘発による遺伝子の無作為化」、PCR Methods Appl 2(10):28−33, 1992.
Caton AJおよびKoprowski H、「コンビナトリアル発現ライブラリーから単離されたインフルエンザウイルス赤血球凝集素特異的抗体は、供与体の免疫応答に密接に関与する」、Proc Natl Acad Sci USA 87(16):6450−6454, 1990.
Chakraborty T, Martin JF, Olson EN、「2−ハイブリッドアッセイ系を用いたin vivoにおけるミオゲニンおよびE2A産物のオリゴマー化の分析」、J Biol Chem 267(25):17498−501, 1992.
Chang CN, Landolfi NF, Queen C、「バクテリオファージ表面上での抗体Fabドメインの発現、抗体選択のための使用可能性」、J Immunol 147(10):3610−4, (Nov 15) 1991.
Chaudhary VK, Batra JK, Gallo MG, Willingham MC, FitzGerald DJ, Pastan I、「単鎖イムノトキシンとしての大腸菌の機能性可変領域抗体遺伝子を迅速にクローニングする方法」、Proc Natl Acad Sci USA 87(3):1066−1070, 1990.
Chien CT, Bartel PL, Sternglanz R, Fields S、「2−ハイブリッド系:目的のタンパク質と相互作用するタンパク質の遺伝子を同定およびクローニングするための方法」、Proc Natl Acad Sci USA 88(21):9578−9582, 1991.
Chiswell DJ, McCafferty J、「ファージ抗体:新しい「コリクローナル」抗体はモノクローナル抗体に取って代わるか?」、Trends Biotechnol 10(3):80−84, 1992.
Chothia CおよびLesk AM、「免疫グロブリンの超可変領域の基準構造」、J Mol Biol 196(4):901−917, 1987.
Chothia C, Lesk AM, Tramontano A, Levitt M, Smith−Gill SJ, Air G, Sheriff S, Padlan EA, Davies D, Tulip WRら、「免疫グロブリン超可変領域のコンホメーション」、Nature 342(6252):877−883, 1989.
Clackson T, Hoogenboom HR, Griffiths AD, Winter G、「ファージ展示ライブラリーを用いた抗体フラグメントの作製」、Nature 352(6336):624−628, 1991.
Conrad M, Topal MD、「DNAおよびスペルミジンは、制限酵素Nae Iの活性を調節するためのスイッチ機構を提供する」、Proc Natl Acad Sci U S A 86(24):9707−11, (Dec) 1989.
Coruzzi G, Broglie R, Edwards C, Chua NH、「リブロース‐1,5‐ビスリン酸カルボキシラーゼの小サブユニットをコードするエンドウ豆核遺伝子の組織特異的で光調節型の発現」、EMBO J 3(8):1671−9, 1984.
Dasmahapatra B, DiDomenico B, Dwyer S, Ma J, Sadowski I, Schwartz J、「タンパク質分解酵素の活性を研究するための遺伝系」、Proc Natl Acad Sci USA 89(9):4159−4162, 1992.
Davis LG, Dibner MD, Battey JF、Basic Methods in Molecular Biology.(「分子生物学の基本的方法」)、Elsevier, New York, NY、(著作権)、1986.
Delegrave SおよびYouvan DC. Biotechnology Research 11:1548−1552, 1993.
DeLong EF, Wu KY, Prezelin BB, Jovine RV、「南極海ピコプランクトン中の大量の古細菌」、Nature 371(6499):695−697, 1994.
Deng SJ, MacKenzie CR, Sadowska J, Michniewicz J, Young NM, Bundle Dr, Narang SA、「ファージ展示による、改善された炭水化物結合を用いた抗体単鎖可変フラグメントの選択」、J Biol Chem 269(13):9533−9538, 1994.
Duan L, Bagasra O, Laughlin MA, Oakes JW, Pomerantz RJ、「細胞内抗Rev単鎖抗体によるヒト免疫不全ウイルス1型の複製の強力な阻害」、Proc Natl Acad Sci USA 91(11):5075−5079, 1994.
Durfee T, Becherer K, Chen PL, Yeh SH, Yang Y, Kilburn AE, Lee WH, Elledge SJ、「網膜芽腫タンパク質は、1型タンパク質ホスファターゼ触媒ユニットに結合する」、Genes Dev 7(4):555−569, 1993.
Ellington ADおよびSzostak JW、「特異的リガンドに結合するRNA分子のin vitroにおける選択」、Nature 346(6287):818−822, 1990.
Fields SおよびSong 0、「タンパク質間相互作用を検出するための新規遺伝系」、Nature 340(6230):245−246, 1989.
Firek S, Draper J, Owen MR, Gandecha A, Cockburn B, Whitelam GC、「トランスジェニックタバコ植物および細胞懸濁培養における機能性単鎖Fvタンパク質の分泌」、Plant Mol Biol 23(4):861−870, 1993.
Forsblom S, Rigler R, Ehrenberg M, Philipson L、「制限エンドヌクレアーゼEco RIによるアデノウイルスDNAの切断に関する反応速度論的研究」、Nucleic Acids Res 3(12):3255−69, (Dec) 1976.
Germino FJ, Wang ZX, Weissman SM、「in vivoにおけるタンパク質間相互作用のスクリーニング」、Proc Natl Acad Sci USA 90(3):933−937, 1993.
Gingeras TR, Brooks JE、「Pseudomonas aeruginosa由来クローン化制限/修飾系」、Proc Natl Acad Sci USA 80(2):402−6, 1983 (Jan).
Gluzman Y、「SV40により形質転換されたサル細胞は、初期SV40突然変異体の複製を支持する」、Cell 23(1):175−182, 1981.
Gruber M, Schodin BA, Wilson ER, Kranz DM、「大腸菌で発現された二重特異性単鎖抗体を介した効率的な腫瘍細胞溶解」、J Immunol 152(11):5368−5374, 1994.
Guarente L、「相互作用タンパク質の同定のための戦略」、Proc Natl Acad Sci USA 90(5):1639−1641, 1993.
Guilley H, Dudley RK, Jonard G, Balazs E, Richards KE、「カリフラワーモザイクウイルスDNAの転写:プロモーター配列の検出および転写物の特性付け」、Cell 30(3):763−73, 1982.
Hardy CF, Sussel L, Shore D、「転写沈黙化およびテロメア長調節に関与するRAP1相互作用タンパク質」、Genes Dev 6(5):801−814, 1992.
Hawkins REおよびWinter G、「種々の遺伝子ライブラリーから抗体を作製するための細胞選択戦略:記憶プールのトラッピング」、Eur J Immunol 22(3):867−870, 1992.
Holvoet P, Laroche Y, Lijnen HR, Van Hoef B, Brouwers E, De Cock F, Lauwereys M, Gansemans Y, Collen D、「フィブリン特異的抗体の単鎖Fvフラグメントおよび単鎖ウロキナーゼからなる単鎖キメラプラスミノーゲンアクチベーターの生化学的特性付け」、Eur J Biochem 210(3):945−952, 1992.
Honjo T, Alt FW, Rabbitts TH (編)、Immunoglobulin genes. Academic Press: San Diego, CA, pp. 361−368, (著作権)、1989.
Hoogenboom HR, Griffiths AD, Johnson KS, Chiswell DJ, Judson P, Winter G、「糸状ファージの表面上の多サブユニットタンパク質:抗体(Fab)重鎖および軽鎖の提示方法」、Nucleic Acids Res 19(15):4133−4137, 1991.
Huse WD, Sastry L, Iverson SA, Kang AS, Alting−Mees M, Burton DR, Benkovic SJ, Lerner RA、「ファージλにおける免疫グロブリンレパートリーの大規模コンビナトリアルライブラリーの作製」、Science 246(4935):1275−1281, 1989.
Huston JS, Levinson D, Mudgett−Hunter M, Tai MS, Novotney J, Margolies MN, Ridge RJ, Bruccoleri RE, Haber E, Crea Rら、「抗体結合部位のタンパク質工学:大腸菌において産生される抗ジゴキシン単鎖Fv類似体の特異的活性の回復」、Proc Natl Acad Sci USA 85(16):5879−5883, 1988.
Iwabuchi K, Li B, Bartel P, Fields S、「オリゴマー化に関与するp53のドメインを同定するための2−ハイブリッド系の使用」、Oncogene 8(6):1693−1696, 1993.
Jackson AL, Pahl PM, Harrison K, Rosamond J, Sclafani RA、「Dbf4タンパク質との結合による酵母Cdc7タンパク質キナーゼの細胞周期調節」、Mol Cell Biol 13(5):2899−2908, 1993.
Johnson SおよびBird RE、Methods Enzymol 203:88, 1991.
Kabatら、Sequences of Proteins of Immunological Interest (「免疫学的目的のタンパク質の配列」)、第4版、U.S. Department of Health and Human Services, Bethesda, MD (1987)
Kang AS, Barbas CF, Janda KD, Benkovic SJ, Lerner RA、「ファージ表面にコンビナトリアル抗体Fabライブラリーを組み立てることによる、認識機能と複製機能の連結」、Proc Natl Acad Sci USA 88(10):4363−4366, 1991.
Kettleborough CA, Ansell KH, Allen RW, Rosell−Vives E, Gussow DH, Bendig MM、「ファージ抗体ライブラリーを用いた免疫感作マウスからの腫瘍細胞特異的単鎖Fvの単離およびこれらの抗体フラグメントからの全抗体の再構築」、Eur J Immunol 24(4):952−958, 1994.
Kruger DH, Barcak GJ, Reuter M, Smith HO、「EcoRIIは、抵抗性DNA認識部位を切断するように活性化され得る」、Nucleic Acids Res 16(9):3997−4008, (May 11) 1988.Lalo D, Carles C, Sentenac A, Thuriaux P、「酵母RNAポリメラーゼIおよびIIIの3つの共通サブユニット間の相互作用」、Proc Natl Acad Sci USA 90(12):5524−5528, 1993.
Laskowski M Sr、「ヘビ毒ホスホジエステラーゼの精製および特性」、 Methods Enzymol 65(1):276−84, 1980.
Lefkovits IおよびPernis B(編)、Immunological Methods (「免疫学的方法」)、第I巻および第II巻、Academic Press, New York, NY.、第III巻(Orlandoにて刊行)、ならびに第IV巻(San Diegoにて刊行)、(著作権)、1979−.
Ivan Lefkovits(編)、Immunology methods manual the comprehensive sourcebook of techniques. (「免疫学的方法マニュアル:総合技術原典」)、Academic Press, San Diego, (著作権)、1997.
Lerner RA, Kang AS, Bain JD, Burton DR, Barbas CF 3世、「免疫感作のない抗体」、Science 258(5086):1313−1314, 1992.
Leung, D.W.ら、Technique, 1:11−15, 1989.
Li BおよびFields S、「酵母2−ハイブリッド系を用いた、SV40ラージT抗原へのp53の結合に影響するp53の突然変異の同定」、FASEB J 7(10):957−963, 1993.
Lilley GG, Doelzal O, Hillyard CJ, Bernard C, Hudson PJ、「HIVの迅速な診断のための大腸菌で発現された組換え単鎖抗体ペプチドコンジュゲート」、J Immunol Methods 171(2):211−226, 1994.
Lowman HB, Bass SH, Simpson N, Wells JA、「一価ファージ展示による高親和性結合タンパク質の選択」、Biochemistry 30(45):10832−10838, 1991.
Luban J, Bossolt KL, Franke EK, Kalpana GV, Goff SP、「1型ヒト免疫不全ウイルスのGagタンパク質は、シクロフィリンAおよびBに結合する」、Cell 73(6):1067−1078, 1993.
Madura K, Dohmen RJ, Varshavsky A、「N末端則経路におけるN−レコグニン/Ubc2相互作用」、J Biol Chem 268(16):12046−54, (Jun 5) 1993.
Marks JD, Hoogenboom HR, Bonnert TP, McCafferty J, Griffiths AD, Winter G、「バイパス免疫:V遺伝子のファージ展示ライブラリーに由来するヒト抗体」、J Mol Biol 222(3):581−597, 1991.
Marks JD, Griffiths Ad, Malmqvist M, Clackson TP, Bye JM, Winter G、「バイパス免疫:鎖シャッフリングによる高親和性ヒト抗体の構築」、Biotechnology (N Y) 10(7):779−783, 1992.
Marks JD, Hoogenboom HR, Griffiths AD, Winter G、「糸状ファージ上のタンパク質の分子進化:免疫系の戦略の模倣」、J Biol Chem 267(23):16007−16010, 1992.
Maxam AM, Gilbert W、「塩基特異的化学切断を用いた末端標識DNAの配列決定」、Methods Enzymol 65(1):499−560, 1980.
McCafferty J, Griffiths AD, Winter G, Chiswell DJ、「ファージ抗体:抗体可変ドメインを展示する糸状ファージ」、Nature 348(6301):552−554, 1990.
Miller JH.、 Short Course in Bacterial Genetics: Laboratory Manual and Handbook for Escherichia coli and Related Bacteria (「細菌遺伝学の短期講座:大腸菌および関連細菌に関する実験室マニュアルおよびハンドブック」)、(445頁も参照のこと)、Cold Spring Harbor Laboratory Press, Plainview, NY,(著作権)、1992.
Milne GTおよびWeaver DT、「RAD52の優性ネガティブ対立遺伝子は、Rad51およびRad52を含むDNA修復/組換え複合体を明らかにする」、Genes Dev 7(9):1755−1765, 1993.
Mullinax RL, Gross EA, Amberg JR, Hay BN, Hogrefe HH, Kubtiz MM, Greener A, Alting−Mees M, Ardourel D, Short JMら、「バクテリオファージλ免疫発現ライブラリーにおける破傷風トキソイドに特異的なヒト抗体フラグメントクローンの同定」、Proc natl Acad Sci USA 87(20):8095−9099, 1990.
Nath K, Azzolina BA、Gene Amplification and Analysis(Chirikjian JG(編))、第1巻、 p. 113, Elsevier North Holland, Inc., New York, New York,(著作権)、1981.
Needleman SBおよびWunsch CD、「2種のタンパク質のアミノ酸配列における類似性を検索するために適用可能な一般的方法」、J Mol Biol 48(3):443−453, 1970.
Nelson M, Christ C, Schildkraut I、「DNAメチラーゼによる見掛け上の制限エンドヌクレアーゼ認識特異性の変化」、Nucleic Acids Res 12(13):5165−73, 1984 (Jul 11).
Nicholls PJ, Johnson VG, Andrew SM, Hoogenboom HR, Raus JC, Youle RJ、「in vitroでウサギ網状赤血球溶解物において産生される単鎖抗体(sFv)‐トキシン融合タンパク質の特性評価」、J Biol Chem 268(7):5302−5308, 1993.
Oller AR, Vanden Broek W, Conrad M, Topal MD、「いくつかの細菌種に由来する制限エンドヌクレアーゼの活性に影響するDNAおよびスペルミジンの能力」、Biochemistry 30(9):2543−9, (Mar 5) 1991.
Owens RJおよびYoung RJ、「モノクローナル抗体の遺伝子工学」、J Immunol Methods 168(2):149−165, 1994.
Pearson WRおよびLipman DJ、「生物学的配列比較のための改善されたツール」、Proc Natl Acad Sci USA 85(8):2444−2448, 1988.
Pein CD, Reuter M, Meisel A, Cech D, Kruger DH、「制限エンドヌクレアーゼEcoRIIの活性化は、刺激因子DNAの切断に依存しない」、Nucleic Acids Re s 19(19):5139−42, (Oct 11) 1991.
Persson MA, Caothien RH, Burton DR、「レパートリークローニングによる多様な高親和性ヒトモノクローナル抗体の作製」、Proc Natl Acad Sci USA 88(6):2432−2436, 1991.
Queen C, Foster J, Stauber C, Stafford J、「プロモーターおよびエンハンサーエレメントによるκ‐免疫グロブリン遺伝子の細胞型特異的調節」、Immunol Rev 89:49−68, 1986.
Qiang BQ, McClelland M, Poddar S, Spokauskas A, Nelson M、「NotI (5’−GCGGCCGC−3’)の見掛け上の特異性は、M.FnuDIIまたはM.BepIメチルトランスフェラーゼ(5’−mCGCG−3’)により増強される:細菌染色体の、いくつかの大きい断片への切断」、Gene 88(1):101−5, (Mar 30) 1990.
Raleigh EA, Wilson G、「大腸菌K−12株は、5‐メチルシトシン含有DNAを制限する」、Proc Natl Acad Sci U S A 83(23):9070−4, (Dec) 1986.
Reidhaar−Olson JFおよびSauer RT、「タンパク質配列の情報内容のプローブとしてのコンビナトリアルカセット突然変異誘発」、Science 241(4861):53−57, 1988.
Riechmann LおよびWeill M、「部位特異的ランダム単鎖抗体Fvフラグメントの親和性の改善のための該フラグメントのファージ展示および選択」、Biochemistry 32(34):8848−8855, 1993.
Roberts RJ, Macelis D、「REBASE‐制限酵素およびメチラーゼ」、Nucleic Acids Res 24(1):223−35, (Jan 1) 1996.
Ryan AJ, Royal CL, Hutchinson J, Shaw CH、「アブラナ(Brassica napusすなわちjet neuf).由来12S種子保存タンパク質のゲノム配列」、Nucl Acids Res 17(9):3584, 1989.
Sambrook J, Fritsch EF, Maniatis T.、Molecular Cloning: Laboratory Manual. (「分子クローニング:実験室マニュアル」)、Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY,(著作権)、1982.
Sambrook J, Fritsch EF, Maniatis T.、Molecular Cloning: Laboratory Manual. (「分子クローニング:実験室マニュアル」)、第2版、Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, (著作権)、1989.
Scopes RK.、Protein Purification: Principles and Practice.(「タンパク質 の精製:原理と実践」)、Springer−Verlag, New York, NY, (著作権)、1982.
Silver SCおよびHunt SW 3世、「相互作用転写調節タンパク質をコードするcDNAのクローニング技術」、Mol Biol Rep 17(3):155−165, 1993.
Smith TF, Waterman MS. Adv Appl Math 2: 482−論文の最終頁, 1981.
Smith TF, Waterman MS、「重複遺伝子および情報理論」、J Theor Biol 91(2):379−80, (Jul 21) 1981.
Smith TF, Waterman MS、「共通分子サブ配列の同定」、J Mol Biol 147(1):195−7, (Mar 25) 1981.
Smith TF, Waterman MS, Fitch WM、「比較生物配列メトリックス」、J Mol Evol S18(1):38−46, 1981.
Staudinger J, Perry M, Elledge SJ, Olson EN、「2‐ハイブリッド系を用いた酵母における脊椎動物へリックス‐ループ‐へリックスタンパク質間の相互作用」、J Biol Chem 268(7):4608−4611, 1993.
Stemmer WP, Morris SK, Wilson BS、「酵素的逆方向PCRにより調製されたタンパク質リンカーライブラリーに由来する活性単鎖Fv抗体の選択」、Biotechniques 14(2):256−265, 1993.
Stemmer WP、「ランダム断片化および再構成によるDNAシャッフリング:分子進化のためのin vitroでの組換え」、Proc Natl Acad Sci USA 91(22):10747−10751, 1994.
Sun D, Hurley LH、「大腸菌DNAポリメラーゼを介するin vitro DNA合成に対する(+)−CC−1065−(N3−アデニン)DNA付加物の効果」、Biochemistry 31:10, 2822−9, (Mar 17) 1992,
Tague BW, Dickinson CD, Chrispeels MJ、「植物液胞タンパク質フィトヘマグルチニンの短いドメインは、酵母液胞のインベルターゼを標的にする」、Plant Cell 2(6):533−46, (June) 1990.
Takahashi N, Kobayashi I、「バクテリオファージλ組換えの2本鎖破壊修復モデルの根拠」、Proc Natl Acad Sci U S A 87(7):2790−4, (Apr) 1990.
Thiesen HJおよびBach C、「標的検出アッセイ (TDA): SP1タンパク質で実証されたようなDNA結合部位を決定するための万能法」、Nucleic Acids Res 18(11):3203−3209, 1990.
Thomas M, Davis RW、「EcoRI制限エンドヌクレアーゼによるバクテリオファージλの切断に関する研究」、J Mol Biol 91(3):315−28, (Jan 25) 1975.
Tingey SV, Walker EL, Corruzzi GM、「エンドウ豆グルタミン合成酵素遺伝子は、葉、根、および節で特異的に発現される異なるポリペプチドをコードする」EMBO J 6(1):1−9, 1987.
Topal MD, Thresher RJ, Conrad M, Griffith J、「pBR322のDNAに結合するNaeIエンドヌクレアーゼは、ループ化を誘導する」、Biochemistry 30(7):2006−10, (Feb. 19) 1991.
Tramontano A, Chothia C, Lesk AM、「構造残基71は、免疫グロブリンのVHドメインにおける第2の超可変領域の位置およびコンホメーションの主要な決定基である」、J Mol Biol 215(1):175−182, 1990.
Tuerk CおよびGold L、「指数的富化によるリガンドの系統進化:バクテリオファージT4 DNAポリメラーゼに対するRNAリガンド」、Science 249(4968):505−510, 1990.
van de Poll ML, Lafleur MV, van Gog F, Vrieling H, Meerman JH、「N−アセチル化およびデアセチル化4’‐フルオロ‐4‐アミノビフェニルおよび4‐アミノビフェニル付加物は、1本鎖M13のin vitroにおけるDNA複製および大腸菌における1本鎖φX174のDNA複製を阻害するその能力において異なる」、Carcinogenesis 13(5):751−8, (May) 1992.
Vojtek AB, Hollenberg SM, Cooper JA、「哺乳動物のRasは、セリン/トレオニンキナーゼRafと直接的に相互作用する」、Cell 74(1):205−214, 1993.
Wenzler H, Mignery G, Fisher L, Park W、「トランスジェニックタバコ植物の葉におけるキメラジャガイモ塊茎遺伝子のスクロース調節性発現」、Plant Mol Biol 13(4):347−54, 1989.
WilliamsおよびBarclay、Immunoglobulin GenesThe Immunoglobulin Gene Superfamily (「免疫グロブリン遺伝子免疫グロブリン遺伝子スーパーファミリー」)
Winnacker EL.、From Genes to Clones: Introduction to Gene Technology.(「遺伝子からクローンまで:遺伝子技術入門」)、VCH Publishers, New York, NY,(著作権)、1987.
Winter GおよびMilstein C、「人工抗体」、Nature 349(6307):293−299, 1991.
Yang X, Hubbard EJ, Carlson M、「2‐ハイブリッド系により同定されたタンパク質キナーゼ基質」、Science 257(5070):680−2, (Jul 31) 1992.
米国特許第4,683,195号; 1986年2月7日出願, 1987年7月28日発行. Mullis KB, Erlich HA, Arnheim N, Horn GT, Saiki RK, Scharf SJ、「核酸配列を増幅、検出、および/またはクローニングするための方法」
米国特許第4,683,202号; 1985年10月25日出願, 1987年7月28日発行. Mullis KB、「核酸配列を増幅するための方法」
米国特許第4,704,362号; 1979年11月5日出願, 1987年11月3日発行. Itakura K, Riggs AD、「組換えクローニングベヒクル微生物ポリペプチドの発現」
WO 88/08453; 1988年4月14日出願, 1988年11月3日公開. Alakhov JB, Baranov, VI, Ovodov SJ, Ryabova LA, Spirin AS、「無細胞翻訳系におけるポリペプチドの取得方法」
WO 90/05785; 1989年11月15日出願, 1990年5月31日公開. Schultz P、「タンパク質中に非天然アミノ酸を部位特異的に組み込むための方法」
WO 90/07003;1989年1月27日出願, 1990年6月28日公開. Baranov VI, Morozov IJ, Spirin AS、「無細胞系のコンジュゲートされた転写/翻訳における遺伝子の予備的発現のための方法」
WO 91/02076; 1990年6月14日出願, 1991年2月21日公開. Baranov VI, Ryabova LA, Yarchuk OB, Spirin AS、「無細胞系におけるポリペプチドの取得方法」
WO 91/05058; 1989年10月5日出願, 1991年4月18日公開. Kawasaki G、「新規遺伝子およびポリペプチドの無細胞系および単離」
WO 91/17271; 1990年5月1日出願, 1991年11月14日公開. Dower WJ, Cwirla SE、「組換えライブラリーのスクリーニング方法」
WO 91/18980; 1991年5月13日出願, 1991年12月12日公開. Devlin JJ、「生物学的活性分子を同定するための組成物および方法」
WO 91/19818; 1990年6月20日出願, 1991年12月26日公開. Dower WJ, Cwirla SE, Barrett RW、「ペプチドライブラリーおよびスクリーニング系」
WO 92/02536; 1991年8月1日出願, 1992年2月20日公開. Gold L, Tuerk C、「逆翻訳による系統的ポリペプチド進化」
WO 92/03918; 1991年8月28日出願, 1992年3月19日公開. Lonberg N, Kay RM、「異種抗体を産生し得るトランスジェニック非ヒト動物」
WO 92/03918; 1991年8月28日出願, 1992年3月19日公開. Lonberg N, Kay RM、「異種抗体を産生し得るトランスジェニック非ヒト動物」
WO 92/05258; 1991年9月17日出願, 1992年4月2日公開. Fincher GB、「オオムギ酵素をコードする遺伝子」
WO 92/14843; 1992年2月21日出願, 1992年9月3日公開. Toole JJ, Griffin LC, Bock LC, Latham JA, Muenchau DD, Krawczyk S、「生物分子特異的アプタマーおよびその作製方法」
WO 93/08278; 1992年10月15日出願, 1993年4月29日公開. Schatz PJ, Cull MG, Miller JF, Stemmer WP、「ペプチドライブラリーおよびそのスクリーニング方法」
WO 93/12227; 1992年12月17日出願, 1993年6月24日公開. Lonberg, N; Kay RM、「異種抗体を産生し得るトランスジェニック非ヒト動物」
WO 93/12227; 1992年12月17日出願, 1993年6月24日公開. Lonberg N, Kay RM、「異種抗体を産生し得るトランスジェニック非ヒト動物」
WO 94/25585; 1994年4月25日出願, 1994年11月10日公開. Lonberg, N, Kay RM、「異種抗体を産生し得るトランスジェニック非ヒト動物」
WO 94/25585; 1994年4月25日出願, 1994年11月10日公開. Lonberg N, Kay RM、「異種抗体を産生し得るトランスジェニック非ヒト動物」
Arslan T, Abraham AT, Hecht SM、「構造的に変化したDNAトポイソメラーゼIの基質 1個の3’‐デオキシヌクレオチドを切れやすい鎖に含有させる効果」、Nucleosides Nucleotides 1998 Jan−Mar;17(1−3):515−30.
Aupeix K, Toulme JJ、「RNAヘアピンの2本鎖基部への化学修飾オリゴヌクレオチドの結合」、Nucleosides Nucleotides 1999 Jun−Jul;18(6−7):1647−50.
Bazzanini R, Manfredini S, Durini E, Groschel B, Cinatl J, Balzarini J, De Clercq E, Imbach JL, Perigaud C, Gosselin G、「S−アシル−2−チオエチル (SATE)生物的不安定リン酸保護基を有するAra−CMPおよびAra−AMPのプロドラッグ:合成および生物学的評価」、Nucleosides Nucleotides 1999 Apr−May;18(4−5):971−2.
Blackburn GM, Liu X, Rosler A, Brenner C、「ヒト脆弱ヒスチジン三価タンパク質(Fhit)に関する研究のためのジアデノシン5’,5’’’‐P1,P3‐三リン酸の2つのヒドロラーゼ耐性類似体」、Nucleosides Nucleotides 1998 Jan−Mar;17(1−3):301−8.
Bridson PK, Lin X, Melman N, Ji XD, Jacobson KA、「7‐β‐D‐リボフラノシルキサンチンの合成およびアデノシン受容体親和性」、Nucleosides Nucleotides 1998 Apr;17(4):759−68.
Brodin P, Gottikh M, Auclair C, Mouscadet JF、「一官能性および二官能性三重らせん形成オリゴヌクレオチドによるHIV−1組込みの阻害」、Nucleosides Nucleotides 1999 Jun−Jul;18(6−7):1717−8.
Creighton TE、Proteins Structures and Molecular Principles.(「タンパク質構造と分子的原理」)、New York: W. H. Freeman and Co., 1984.
De Clercq E、「S−アデノシルホモシステインヒドロラーゼ阻害剤および抗ウイルス剤としてのカルボサイクリックアデノシン類似体:最近の進歩」、Nucleosides Nucleotides 1998 Jan−Mar;17(1−3):625−34.
de Zwart M, Link R, von Frijtag Drabbe Kunzel JK, Cristalli G, Jacobson KA, Townsend−Nicholson A, IJzerman AP、「アデノシンA2B受容体におけるアデノシン類似体の機能的スクリーニング:強力なアゴニストの探索」、Nucleosides Nucleotides 1998 Jun;17(6):969−85.
Egron D, Arzumanov AA, Dyatkina NB, Krayevsky A, Imbach JL, Aubertin AM, Gosselin G, Perigaud C、「3’−アジド−2’,3’−ジデオキシチミジン5’−フルオロリン酸の合成、抗HIV活性および安定性に関する研究」、Nucleosides Nucleotides 1999 Apr−May;18(4−5):983−4
Gianolio DA, McLaughlin LW、「拡張機能を有するピリミジン誘導体の合成およびトリプレックス形成特性」、Nucleosides Nucleotides 1999 Aug;18(8):1751−69.
Gottikh MB, Volkov EM, Romanova EA, Oretskaya TS, Shabarova ZA、「HIV−1のDNA組込みを阻害し得るオリゴヌクレオチド挿入剤コンジュゲートの合成」、Nucleosides Nucleotides 1999 Jun−Jul;18(6−7):1645−6.
Hotoda H, Koizumi M, Ohmine T, Furukawa H, Nishigaki T, Abe K, Kosaka T, Tsutsumi S, Sone J, Kaneko M、「生物学的活性オリゴデオキシリボヌクレオチド 10:グリセロール骨格を有する修飾ヘキサヌクレオチドの抗HIV−1活性および安定性」、Nucleosides Nucleotides 1998 Jan−Mar;17(1−3):243−52.
JP10113194; 1997年10月22日出願, 1998年5月6日公開, Donnelly, JJ ;Dwarki, VJ ;Liu, MA ;Montgomery, DL ;Parker, S ;Shiver, JW ;Ulmer JB、「核酸調製法」
Kang SH, Sinhababu AK, Cho MJ、2’‐デオキシウリジン5’‐一リン酸のビス(ピバロイルオキシメチル)エステルの合成およびその生物学的活性」、Nucleosides Nucleotides 1998 Jun;17(6):1089−98.
Krayevsky A, Arzumanov A, Shirokova E, Dyatkina N, Victorova L, Jasko M, Alexandrova L、「三リン酸残基で修飾したdNTP:DNAポリメラーゼに対する基質特性およびヒト血清における安定性」、Nucleosides Nucleotides 1998 Jan−Mar;17(1−3):681−93.
Krayevsky AA, Dyatkina NB, Semizarov DG, Victorova LS, Shirokova EA, Theil F, Von Janta Lipinski MJ, Gosselin G, Imbach JL、「DNA生合成における修飾L−dNTPの基質活性の理由および限界」、Nucleosides Nucleotides 1999 Apr−May;18(4−5):863−4.
Kvasyuk EI, Mikhailopulo IA, Suhadolnik RJ, Henderson EE, Muto NF, Iacono KT, Homon J, Pfleiderer W、「5’‐末端5’‐アミノ‐5’‐デオキシ‐および5’‐アミノ‐3’,5’‐ジデオキシアデノシン誘導体を含む2’,5’‐オリゴアデニル酸三量体の合成およびその生物学的活性」、Nucleosides Nucleotides 1999 Jun−Jul;18(6−7):1483−4.
Liu J, Skradis A, Kolar C, Kolath J, Anderson J, Lawson T, Talmadge J, Gmeiner WH、「5‐FUと比較したFdUMP[10]の増大した細胞毒性および減少したin vivo毒性」、Nucleosides Nucleotides 1999 Aug;18(8):1789−802.
Lutz MJ, Will DW, Breipohl G, Benner SA, Uhlmann E、「単荷電ペプチド核酸(PNA)類似体の合成およびDNAポリメラーゼによる基質としてのその認識」、Nucleosides Nucleotides 1999 Mar;18(3):393−401.
Monaco V, van de Wetering KI, Meeuwenoord NJ, van den Elst HA, Stuivenberg HR, Visse R, van der Kaaden JC, Moolenaar GF, Verhoeven EE, Goosen N, van der Marel GA, van Boom JH、「大腸菌におけるヌクレオチド切出し修復に関する研究のための修飾DNA断片の合成および生物学的評価」、Nucleosides Nucleotides 1999 Jun−Jul;18(6−7):1339−41.
Morozova OV, Kolpashchikov DM, Ivanova TM, Godovikova TS、「新規光架橋5‐C塩基置換UTP類似体の合成およびダニ媒介脳炎ウイルスRNAレプリカーゼタンパク質の高選択的親和性標識におけるその適用」、Nucleosides Nucleotides 1999 Jun−Jul;18(6−7):1513−4.
Nguyen−Ba N, Chan L, Quimpere M, Turcotte N, Lee N, Mitchell H, Bedard J、「強力な抗HCMV剤としてのヌクレオチド類似体の新規クラスの設計およびSAR研究」、Nucleosides Nucleotides 1999 Apr−May;18(4−5):821−7.
Pandolfi D, Rauzi F, Capobianco ML、「3’‐および5’‐エキソヌクレアーゼに対するオリゴヌクレオチドの安定性に関する異なる型の末端キャッピング修飾の評価」、Nucleosides Nucleotides 1999 Sep;18(9):2051−69.
Pankiewicz KW, Lesiak−Watanabe K、「強力な抗癌剤および細胞分化誘導剤としての新規ミコフェノールアデニンビス(リン酸)」、Nucleosides Nucleotides 1999 Apr−May;18(4−5):927−32.
Perrin DM, Garestier T, Helene C、「核酸触媒の触媒レパートリーの拡張:アンモニウムおよびイミダゾリル官能基を有する2つの修飾デオキシリボヌクレオシド三リン酸の同時組込み」、Nucleosides Nucleotides 1999 Mar;18(3):377−91.
Pfundheller HM, Koshkin AA, Olsen CE, Wengel J、「2つの新規2’‐O‐メチル修飾ヌクレオチドモノマーを含むオリゴヌクレオチドの評価:3’‐C‐アリルおよび2’‐O,3’‐C結合二員環誘導体」、Nucleosides Nucleotides 1999 Sep;18(9):2017−30.
Ramasamy KS, Stoisavljevic V、「非環式アミノアルコールヌクレオシド類似体を含む修飾オリゴヌクレオチドの合成およびその生物物理学的研究」、Nucleosides Nucleotides 1999 Aug;18(8):1845−61.
Schinazi RF, Lesnikowski ZJ、「ホウ素含有オリゴヌクレオチド」、Nucleosides Nucleotides 1998 Jan−Mar;17(1−3):635−47.
Secrist JA 3世, Parker WB, Allan PW, Bennett LL Jr, Waud WR, Truss JW, Fowler AT, Montgomery JA, Ealick SE, Wells AH, Gillespie GY, Gadi VK, Sorscher EJ、「癌の遺伝子療法:大腸菌プリンヌクレオシドホスホリラーゼによるヌクレオシドプロドラッグの活性化」、Nucleosides Nucleotides 1999 Apr−May;18(4−5):745−57.
Shirokova EA, Shipitsin AV, Victorova LS, Dyatkina NB, Goryunova LE, Beabealashvilli RS, Hamilton CJ, Roberts SM, Krayevsky AA、「新型抗ウイルス剤としての修飾ヌクレオシド5’‐三リン酸」、Nucleosides Nucleotides 1999 Apr−May;18(4−5):1027−8.
Srivastava TK, Friedhoff P, Pingoud A, Katti SB、「セラチア菌エンドヌクレアーゼによるホスホジエステル加水分解に関する研究におけるメチルホスホン酸オリゴヌクレオシドの応用」、Nucleosides Nucleotides 1999 Sep;18(9):1945−60.
Stattel JM, Yanachkov I, Wright GE、「N2−(p−n−ブチルフェニル)−2’−デオキシグアノシン5’−(α,β‐イミド)三リン酸(BuPdGMPNHPP)の合成および生化学的研究:BファミリーDNAポリメラーゼの非基質阻害剤」、Nucleosides Nucleotides 1998 Aug;17(8):1505−13.
Terato H, Morita H, Ohyama Y, Ide H、「水溶液におけるシステイン誘導体による5‐ホルミルウラシルの新規改変」、Nucleosides Nucleotides 1998 Jan−Mar;17(1−3):131−41.
Tomikawa A, Seno M, Sato−Kiyotaki K, Ohtsuki C, Hirai T, Yamaguchi T, Kawaguchi T, Yoshida S, Saneyoshi M、「合成ヌクレオシドおよびヌクレオチド.40;9−(β−D−アラビノフラノシル)−2−(p−n−ブチルアニリノ)アデニン 5’−三リン酸 (BuAaraATP)およびその2’−upアジド類似体による真核生物DNAポリメラーゼαの選択的阻害:合成および酵素的評価」、Nucleosides Nucleotides 1998 Jan−Mar;17(1−3):487−501.
米国特許第5,580,859号; 1994年3月18日出願, 1996年12月3日発行. Felgner, PL. ;Wolff, JA. ;Rhodes, GH. ;Malone, RW. ;Carson, DA.、「哺乳動物における外因性DNA配列の送達」
米国特許第5,589,466号; 1995年1月26日出願, 1996年12月31日発行. Felgner, PL. ;Wolff, JA. ;Rhodes, GH. ;Malone, RW. ;Carson, DA.、「DNA配列の注入による哺乳動物における保護免疫応答の誘導」
米国特許第5,641,665号; 1994年11月28日出願, 1997年6月24日発行. Hobart, PM. ;Margalith, M ;Parker, SE. ;Khatibi, S、「IL−2の発現に適したプラスミド」
米国特許第5,693,622号; 1995年6月7日出願, 1997年12月2日発行. Wolff, JA. ;Duke, DJ. ;Felgner, PL.、「哺乳動物の心筋における外因性ポリヌクレオチド配列の発現」
米国特許第5,703,055号; 1994年1月26日出願, 1997年12月30日発行. Felgner, PL. ;Wolff, JA ;Rhodes, GH. ;Malone, RW ;Carson, DA.、「脂質媒介性DNA送達による抗体の作製」
米国特許第5,846,946号; 1996年6月14日出願, 1998年12月8日発行. Huebner, RC. ;Norman, JA. ;Liang, X ;Carner, KR. ;Barbour, AG. ;Luke, CJ.、「ボレリアDNAを投与するための組成物および方法」
米国特許第5,910,488号; 1995年12月1日出願, 1999年6月8日発行. Nabel, GJ. ;Nabel, EG. ;Lew, D ;Marquet, M、「遺伝子療法に適したプラスミド」
Victorova LS, Semizarov DG, Shirokova EA, Alexandrova LA, Arzumanov AA, Jasko MV, Krayevsky AA、「ヒトDNAポリメラーゼおよびレトロウイルス逆転写酵素:三リン酸残基で修飾されたdNTPsに関する選択性」、Nucleosides Nucleotides 1999 Apr−May;18(4−5):1031−2.
von Janta−Lipinski M, Gaertner K, Lehmann C, Scheer H, Schildt J, Matthes E、「修飾オリゴヌクレオチドに対する標的としてのヒトテロメラーゼのタンパク質およびRNA」、Nucleosides Nucleotides 1999 Jun−Jul;18(6−7):1719−20
WO9011092; 1990年3月21日出願, 1990年10月4日A1公開. Felgner, PL. ;Wolff, JA;Rhodes, GH. ;Malone, RW ;Carson, DA.、「脊椎動物における外因性ポリヌクレオチド配列の発現」
WO9314778; 1993年1月21日, 1993年8月5日A1公開. Rhodes, GH. ;Dwarki, VJ.;Felgner, PL;Wang−Felgner, J;Manthorpe, M、「ex vivoにおける遺伝子導入」
WO9421797; 1994年3月14日, 1994年9月29日A1公開. Donnelly, JJ. ;Dwarki, VJ. ;Liu, MA. ;Montgomery, DL. ;Parker, SE. ;Shiver, JW. ;Ulmer, JB.、「核酸医薬」
WO9633736; 1996年4月26日出願, 1996年10月31日A1公開. Baruch DI; Pasloske BL; Howard, RJ、「マラリアペプチドおよびワクチン」
WO9735992; 1997年3月17日出願, 1997年10月2日A1公開. Hobart, PM. ;Liang, X、「テトラサイクリン誘導/抑制系」
WO9926663; 1998年11月20日出願, 1999年6月3日A2公開. Horton, H ;Parker, S;Manthorpe, M; Felgner, P、「サイトカイン発現ポリヌクレオチドおよびそのための組成物を用いた癌の治療」
WO9941368; 1999年2月10日出願, 1999年8月19日A2公開. Punnonen J, Stemmer WP, Whalen RG; Howard, R、「遺伝子ワクチンの免疫調節特性の最適化」
WO9941369; 1999年2月10日出願, 1999年8月19日A2公開. Punnonen J, Stemmer WP, Whalen RG; Howard, R、「遺伝子ワクチンベクター工学」
WO9941383; 1999年2月10日出願, 1999年8月19日A1公開. Punnonen J, Bass, SH, Whalen, RG, Howard, R, Stemmer, WP、「抗原ライブラリー免疫感作」
WO9941402; 1999年2月10日出願, 1999年8月19日A2公開. Punnonen J, Stemmer, WP, Howard R, Patten PA、「遺伝子ワクチンベクターのターゲッティング」
【図面の簡単な説明】
【図1】
図1は、酵素エキソヌクレアーゼIIIの活性を示す。これは、ポリヌクレオチドビルディングブロックをシャッフル、集合、再集合、再結合および/または連鎖(concatenate)させるのに用い得る典型的な酵素である。星印は、この酵素が該ポリヌクレオチド基質の3′方向から5′方向へと作用することを表わしている。
【図2】
図2は、エキソヌクレアーゼに媒介されるポリヌクレオチド再集合における酵素エキソヌクレアーゼIIIの適用例を示す。適当な宿主(例えば、大腸菌、シュードモナス、ストレプトミセス、またはバチルス)を形質転換し、その宿主の修復機構を利用して、発現スクリーニングにより分析し得るクローン化され突然変異を誘発された子孫核酸(および好ましくはかかる核酸によって発現されたポリペプチド)のライブラリーを作製することによりさらなる多様性をもたらすことによる、in vivoにおける「修復」の組合わせた使用も示す。
【図3】
図3は、多結合核酸鎖の生成を示す。この場合、生成した鎖は、親鋳型と同じ長さのものであるが、メチル化されていない。従って、DpnI処理を用いて、生成した鎖を選択することができる。示してはいないが、この鋳型ならびに生成した産物は、ベクター(線状または環状)の一部であってもよい。
【図4】
図4は、異種核酸複合体におけるアニーリングした核酸鎖のハイブリダイズしていない一本鎖末端から、3’および5’末端ヌクレオチドを遊離させるための手段としてのエキソヌクレアーゼ処理の使用を示す。この処理により、短く切断されているがハイブリダイズした末端が遊離して、処理した末端のポリメラーゼに基づく伸長および/またはリガーゼに媒介されるライゲーションが容易になる。
また、適当な宿主(例えば、大腸菌、シュードモナス、ストレプトミセス、またはバチルス)を形質転換し、その宿主の修復機構を利用して、発現スクリーニングにより分析し得るクローン化され突然変異を誘発された子孫核酸(および好ましくはかかる核酸によって発現されたポリペプチド)のライブラリーを作製することによりさらなる多様性をもたらすことによる、in vivoにおける「修復」の組合わせた使用も示す。
【図5】
図5は、1本のメチル化多結合核酸鎖をいくつかのメチル化されていない単一結合核酸鎖にアニーリングさせる実施例における、エキソヌクレアーゼに媒介される核酸の再集合の使用を示す。アニーリングした核酸鎖は、異種核酸複合体を形成し、異種核酸複合体における複数のアニーリングした核酸鎖のハイブリダイズしていない一本鎖末端から、3’および5’末端ヌクレオチドを遊離させるための手段としてのエキソヌクレアーゼ処理にかけられる。この処理により、短く切断されているがハイブリダイズした末端が遊離して、処理した末端のポリメラーゼに基づく伸長および/またはリガーゼに媒介されるライゲーションが容易になる。その後、自然界でメチル化されてなくキメラの、生成されたアニーリングした単一結合核酸鎖に対して選択するには、DpnIで処理するのが便利である。
【図6】
図6は、複数のメチル化多結合核酸鎖をいくつかのメチル化されていない単一結合核酸鎖にアニーリングさせる実施例における、エキソヌクレアーゼに媒介される核酸の再集合の使用方法を示す。アニーリングした核酸鎖は、異種核酸複合体を形成し、異種核酸複合体における複数のアニーリングした核酸鎖のハイブリダイズしていない一本鎖末端から、3’および5’末端ヌクレオチドを遊離させるための手段としてのエキソヌクレアーゼ処理にかけられる。この処理により、短く切断されているがハイブリダイズした末端が遊離して、処理した末端のポリメラーゼに基づく伸長および/またはリガーゼに媒介されるライゲーションが容易になる。その後、自然界でメチル化されてなくキメラの、生成されたアニーリングした単一結合核酸鎖に対して選択するには、DpnIで処理するのが便利である。[0001]
Field of the invention
The present invention relates to the field of protein engineering. More specifically, the present invention relates to directed evolution methods for preparing a polynucleotide encoding a polypeptide. This method involves the step of generating site-directed mutagenesis (optionally in combination with the step of chimerizing the polynucleotide), selecting potentially desirable progeny molecules by a process called end selection, which is followed by , And may be further screened), and screening for polynucleotides for the production of polypeptides having useful properties.
[0002]
In certain embodiments, the present invention relates to enzymes, particularly thermostable enzymes, and to their production by directed evolution. More particularly, the present invention relates to thermostable enzymes that are stable at high temperatures and have improved activity at lower temperatures.
[0003]
Background of the Invention
Acquiring the full potential of natural diversity can include both the steps of discovery and optimizing what is discovered. For example, the discovery step makes it possible to utilize biological molecules that have industrial utility. However, for certain industrial needs, it may be necessary to further modify these enzymes experimentally to achieve properties beyond what natural evolution has and will likely in the near future. It is advantageous.
[0004]
A process called directed evolution that experimentally modifies biological molecules toward desirable properties is achieved by mutating the template of one or more parent molecules and identifying the desired molecules among progeny molecules. be able to. However, the currently available techniques for directed evolution have some drawbacks. These disadvantages are as follows:
1) Site-directed mutagenesis techniques (eg, crude or low fidelity PCR) require a complete (saturated) range of possible mutations (ie, at each position (site) along the polypeptide sequence). , All possible amino acid substitutions) are ineffective to achieve systematically.
[0005]
2) Comparisons for rapid analysis of a given molecular sequence and potentially a large number of progeny molecules (those that could be obtained by directed evolution of one or more molecular templates) There is no easy systematic means.
[0006]
3) There is no relatively easy systematic means to obtain comprehensive experimental information linking function and structure with respect to molecular position.
[0007]
4) There is no easy systematic means to incorporate internal controls (eg, positive controls) in certain mutagenesis (eg, chimerization) methods.
[0008]
5) There is no easy systematic means for selecting a particular group of progeny molecules (eg, full-length chimeras) from smaller subsequences.
[0009]
Molecular mutations occur spontaneously and have resulted in the production of many biological compounds that have been shown to be useful in certain industrial applications. However, evolution in nature often selects molecular properties that are incompatible with many unmet industrial needs. Further, it is well recognized that where industrially useful mutations are otherwise preferred at the molecular level, natural evolution outweighs the positive selection of such mutations (eg, As beneficial mutations, as well as deleterious mutations). Furthermore, natural evolution is slow, with high fidelity emphasis on reproduction. Finally, natural evolution predominantly favors pathways created by beneficial mutations, but tends to avoid a large number of consecutive negative mutations, and when such negative mutations are combined, Such a tendency is observed even when it may be beneficial or it may lead to a beneficial end state through a bypass.
[0010]
Directed evolution, on the other hand, can occur much more quickly and can be directly directed to evolving to industrially desirable molecular properties that are not available in nature.
[0011]
The intentional and random combination of amino acids in proteins to obtain useful hybrid proteins, and their corresponding biological molecules (ie, DNA, RNA) that encode these hybrid proteins, is very large. The possibility exists. Thus, there is a need to produce and screen a wide variety of such hybrid proteins, particularly a wide variety of random proteins, for a desired application.
[0012]
The complexity of the active sequence of a biological macromolecule (eg, a polynucleotide, a polypeptide, and a molecule comprising both polynucleotide and polypeptide sequences) is termed its information content (“IC”); It is defined as the resistance of the active protein to amino acid sequence mutations (calculated from the minimum number of invariant amino acids (bits) required to represent a family of related sequences having the same function). Proteins that are more sensitive to random mutagenesis have higher information content.
[0013]
The achievements in molecular biology, such as molecular libraries, have allowed the identification of very large numbers of variable bases, and have even provided a method for selecting functional sequences from random libraries. In such libraries, most residues may be mutated (although typically not all at the same time), depending on the changes that are then compensated. Thus, a 100 amino acid protein may contain only 2,000 different mutations, while 20100Combinations of these sequences are possible.
[0014]
The information density is the IC per unit length of the array. The active site of the enzyme tends to have a high information density. In contrast, information flexible linkers in enzymes have a low information density.
[0015]
Current methods that are widely used to create alternative proteins in library form are error-prone polymerase chain reaction and cassette mutagenesis, where specific regions to be optimized are synthesized synthetically. Replace with the mutagenized oligonucleotide. In both cases, a significant number of mutation sites occur around a site in the original sequence.
[0016]
Error prone PCR uses low fidelity polymerization conditions to randomly introduce low levels of point mutations over long sequences. In a mixture of fragments of unknown sequence, the mixture can be mutagenized using error-prone PCR. The published error-prone PCR protocol suffers from the low processivity of the polymerase. Thus, the protocol does not allow random mutagenesis of genes of average size. This limits the practical application of error prone PCR. Some computer simulations suggest that point mutagenesis alone is often too gradual to enable the large-scale cohesive changes required for continuous dramatic sequence evolution. In addition, published error-prone PCR protocols cannot amplify DNA fragments larger than 0.5-1.0 kb, limiting their practical application. Also, error prone repetitive cycles of PCR can lead to the accumulation of neutral mutations that have undesirable consequences (eg, impact on the protein's immunogenicity rather than its binding affinity).
[0017]
In oligonucleotide-directed mutagenesis, short sequences are replaced with synthetically mutagenized oligonucleotides. This approach is not combinatorial because it does not provide a combination of discrete mutations. The limited library size for very long sequence length means that multiple rounds of selection are inevitable to optimize the protein. In mutagenesis with synthetic oligonucleotides, individual clones are sequenced after each round of selection, then they are grouped into families, and if necessary, a single family is selected and converted to a consensus motif. It is necessary to. Such motifs are resynthesized and reinserted into a single gene, followed by additional selection. This step is a statistical obstacle, labor intensive, and impractical for multiple rounds of mutagenesis.
[0018]
Thus, error-prone PCR and oligonucleotide-directed mutagenesis, while useful for single-cycle sequence fine-tuning, are suddenly limited when applied to multiple cycles.
[0019]
Another limitation of error-prone PCR is that the rate of down-mutations increases with the amount of sequence information. As the information content, library size, and mutagenesis rate increase, the equilibrium between up-mutations and down mutations will statistically hinder the choice of further improvement (statistical plateau) ).
[0020]
In cassette mutagenesis, a block of a single template sequence is typically replaced with a (partially) randomized sequence. Therefore, the maximum amount of information that can be obtained is statistically limited by the number of random sequences (ie, library size). This precludes other sequence families that are not currently the best but have greater potential in the long run.
[0021]
Also, mutagenesis with synthetic oligonucleotides requires sequencing of individual clones after each round of selection. Therefore, such an approach is cumbersome and impractical for multiple rounds of mutagenesis.
[0022]
Therefore, error-prone PCR and cassette mutagenesis are most suitable and widely used for relatively low information content fine-tuning regions. One obvious exception is the selection of RNA ligase ribozymes from random libraries using error-prone PCR and multiple rounds of amplification by selection.
[0023]
In nature, most organisms evolve through natural selection and sexual reproduction. Sexual reproduction ensures the mixing and combination of genes in the progeny of the selected individual. During meiosis, homologous chromosomes from the parent align with each other and cross along portions along their length, thereby randomly exchanging genetic material. Such exchange or shuffling of DNA allows an organism to evolve more rapidly.
[0024]
In recombination, the inserted sequences are known to be useful in a homologous environment, so the inserted sequences will still retain considerable information if they are inserted into a new sequence. It is considered to have an amount.
[0025]
The term "Applied Molecular Evolution" ("AME") refers to the application of an evolutionary design algorithm to a particular useful goal. A number of different library formats for AME have been reported for polynucleotides, peptides and proteins (phages, lacI and polysomes), all of which are random crossovers to consciously generate combinatorial libraries. It does not correspond to recombination by (cross-over).
[0026]
Theoretically, there are 2,000 different single mutants in a 100 amino acid protein. However, a protein of 100 amino acids requires 20100This number is far too large to have a number of possible sequence combinations and to examine thoroughly in the usual way. It would be advantageous to develop a system that would allow the generation and screening of all of these possible combination mutations.
[0027]
Some researchers in the art have developed in vivo site-specific recombination systems to create hybrids of light and heavy chain antibody genes for expression in phage systems. We are using. However, these systems are based on specific recombination sites and are accordingly limited. Simultaneous mutagenesis of antibody CDR regions in single chain antibodies (scFV) by overlap extension and PCR has been reported.
[0028]
Others have described methods of generating large populations of large numbers of hybrids using random in vivo recombination. This method requires the recombination of two different plasmid libraries, each with a different selectable marker. This method is limited to a limited number of recombination equal to the number of selectable markers present, with a linear increase in the number of marker genes bound to the selected sequence.
[0029]
In vivo recombination between two homologous but truncated insect toxin genes on a plasmid has been reported as a method for producing hybrid genes. The formation of hybrid molecules by in vivo recombination of substantially mismatched DNA sequences in host cells having a defective mismatch repair enzyme has been reported.
[0030]
Summary of the Invention
The present invention relates generally to the field of nucleic acid engineering and correspondingly encoded recombinant protein engineering. More specifically, the invention relates to the directed evolution of nucleic acids and the resulting evolution of an activity of interest (eg, the activity of a nucleic acid of interest and / or the activity of a particular protein, particularly an enzyme). Screening of clones containing the made nucleic acid.
[0031]
The present invention generally relates to 1) the progeny of a progeny generation that has mutated from one or more ancestral or parental generation templates to achieve at least one point mutation, addition, deletion and / or chimerization. Preparing molecules (including molecules consisting of polynucleotide sequences, molecules consisting of polypeptide sequences, and molecules consisting partially of polynucleotide sequences and partially consisting of polypeptide sequences); 2) Screening for at least one property of interest, such as enhanced enzyme activity or increased stability or novel chemotherapeutic effects, preferably using high-throughput methods; 3) optionally, the parent and / or Obtain and / or classify structural and / or functional information about progeny generation molecules; and 4) Steps 1) to 3) are repeated.
[0032]
In a preferred embodiment, the present invention provides a method of making a mutated progeny polynucleotide, comprising:
(A) {generating a set of progeny polynucleotides by subjecting the set of starting or parent polynucleotides to an exonuclease-mediated reassembly process in vitro;
This allows the exonuclease-mediated reassembly process to be treated with a 3 'exonuclease that acts on the 3' underhang and blunt ends (eg, with exonuclease III), and to remove the 5 'end from the starting double-stranded polynucleotide. Rather, it is exemplified in a non-limiting manner by releasing the nucleotide at the 3 'end, leaving the remaining strand partially or completely free of its original partner, and removing the remaining strand if desired. Can be used to achieve hybridization with another partner;
This allows the exonuclease-mediated reassembly process to further 5 ′ from the starting double-stranded polynucleotide by treatment with a 5 ′ exonuclease that acts on the 5 ′ underhang (eg, with a red alpha gene product). Illustrated in a non-limiting manner, by releasing terminal nucleotides and leaving the remaining strand partially or completely free of its original partner, the remaining strand can be replaced with another partner if desired. Can be used to achieve hybridization with
This allows the exonuclease-mediated reassembly process to be further treated with an exonuclease that acts on overhanging ends, such as the unhybridized ends (eg, with Mung Bean Nuclease or S1 nuclease or E. coli DNA polymerase). By releasing terminal nucleotides from the unhybridized single-stranded ends of the annealed nucleic acid strands in the heteromeric nucleic acid complex and leaving the shortened but hybridized ends. Exemplified in a non-limiting manner, by facilitating polymerase-based extension and / or ligase-mediated ligation of the treated ends;
In addition, this allows the exonuclease-mediated reassembly process to both release exonucleases that release terminal nucleotides from underhanging or blunt ends, and exonucleases that release terminal nucleotides from overhanging ends, such as unhybridized ends. Also exemplified by a double treatment that can be performed by using rather than simultaneously;
The above method.
[0033]
In a preferred aspect of this embodiment, the present invention provides a method for producing a mutated progeny polynucleotide, comprising the step of (a) wherein the starting or parent polynucleotide set is exonuclease-mediated in vitro. Making a set of progeny polynucleotides by subjecting them to the assembly process)
(I) treating the set of 'starting or parent polynucleotides with a 3' exonuclease that acts on 3 'underhangs and blunt ends to release nucleotides at the 3' end instead of the 5 'end;
Thus, the 3 ′ exonuclease is treated with an exonuclease (eg, exonuclease III) to release the nucleotide at the 3 ′ end instead of the 5 ′ end from the starting double-stranded polynucleotide, partially or completely, Illustrated in a non-limiting manner, by leaving the remaining strands free of the original partner, the remaining strands can be used to achieve hybridization with another partner, if desired. ;
The method comprises:
[0034]
In another preferred aspect of this embodiment, the present invention provides a method for making a mutated progeny polynucleotide, comprising the step of (a) wherein the set of starting or parent polynucleotides is exonuclease in vitro. Creating a set of progeny polynucleotides by subjecting them to an mediated reassembly process)
(I) treating the set of 'starting or parent polynucleotides with a 5' exonuclease acting on a 5 'underhang to release nucleotides at the 5' end;
Thus, the 5 ′ exonuclease is treated with an exonuclease (eg, the red alpha gene product) to release the 5 ′ terminal nucleotide from the starting double-stranded polynucleotide and to partially or completely replace its original partner. The remaining strands, which are not included, are exemplified in a non-limiting manner by remaining the remaining strands, which can be used, if desired, to achieve hybridization with another partner;
The method comprises:
[0035]
In yet another preferred aspect of this embodiment, the present invention provides a method for producing a mutated progeny polynucleotide, comprising the step (a) wherein the starting or parent polynucleotide set is exo-in vitro. Making a set of progeny polynucleotides by subjecting them to a nuclease-mediated reassembly process)
(I) treating the set of starting or parent polynucleotides with exonuclease to release terminal nucleotides from the nucleic acid overhang;
Thus, the treatment can be performed by treating with an exonuclease that acts on an overhanging end such as an unhybridized end (for example, by using Mung Bean Nuclease or S1 nuclease or Escherichia coli DNA polymerase) to obtain a heteronucleic acid complex. Polymerase-based extension and / or ligase mediation of the treated ends by releasing nucleotides from the unhybridized single-stranded ends of the annealed nucleic acid strands in the body and leaving shortened but hybridized ends Exemplified in a non-limiting manner by promoting mold ligation;
The method comprises:
[0036]
In yet another preferred aspect of this embodiment, the present invention provides a method for making a mutated progeny polynucleotide, comprising the step (a) (where the starting or parent polynucleotide set is exo-in vitro). Making a set of progeny polynucleotides by subjecting them to a nuclease-mediated reassembly process)
(I) treating the set of 'starting or parent polynucleotides with a 3' exonuclease that acts on 3 'underhangs and blunt ends to release nucleotides at the 3' end instead of the 5 'end, and
(Ii) treating the set of starting or parent polynucleotides with exonuclease to release terminal nucleotides from the nucleic acid overhang;
Consisting of
This allows the exonuclease-mediated reassembly process to remove both exonucleases that release terminal nucleotides from underhang or blunt ends and exonucleases that release terminal nucleotides from overhangs such as unhybridized ends. Provided is a method as described above, which is a dual process that can be performed by using it not concurrently.
[0037]
In yet another preferred aspect of this embodiment, the present invention provides a method for producing a mutated progeny polynucleotide, comprising the step (a) wherein the starting or parent polynucleotide set is exo-in vitro. Making a set of progeny polynucleotides by subjecting them to a nuclease-mediated reassembly process)
(I) treating the set of 'starting or parent polynucleotides with a 5' exonuclease that acts on a 5 'underhang to release nucleotides at the 5' end; and
(Ii) treating the set of starting or parent polynucleotides with exonuclease to release terminal nucleotides from the nucleic acid overhang;
Consisting of
This allows the exonuclease-mediated reassembly process to remove both exonucleases that release terminal nucleotides from underhanging or blunt ends, and exonucleases that release terminal nucleotides from overhangs such as unhybridized ends. Provided is a method as described above, which is a dual process that can be performed by using it not simultaneously.
[0038]
In another preferred embodiment, the invention is a method for producing a mutated progeny polynucleotide having at least one desired property, comprising:
(A) creating a set of progeny polynucleotides by subjecting the set of starting or parent polynucleotides to an exonuclease-mediated reassembly process in vitro; and
(B) selecting a desired subset of progeny polynucleotides by subjecting the set of progeny polynucleotides to a screening and enrichment process based on end selection;
Thereby, the above steps can be performed iteratively and in any order and combination;
This makes the ends compatible for ligation by a process based on end selection;
This allows one or more intermolecular linkages (preferably, within members of a set of progeny polynucleotides to be made, optionally using the creation of ligation compatible ends to achieve assembly and / or reassembly mutagenesis). Promotes a directional connection);
This makes the ligation compatible end creation help facilitate ligation and expression cloning of the set of progeny polynucleotides into an expression vector system;
Thereby, expression cloning of said set of progeny polynucleotides serves to generate a set of polypeptides;
This allows the resulting set of polypeptides to be subjected to an expression screening process; and
Thus, expression screening of a set of progeny polypeptides provides a means to identify a desired molecular species (eg, a mutant polypeptide or polypeptide fragment) having the desired properties (eg, specific enzymatic activity);
The method comprises:
[0039]
In another preferred embodiment, the invention provides a method of producing a mutated progeny polynucleotide from a collection of ancestral polynucleotides, comprising:
(A) annealing one multi-binding nucleic acid strand to two single-binding nucleic acid strands to produce an annealed nucleic acid strand heterocomplex;
Wherein one multi-attached nucleic acid strand and two single-attached nucleic acid strands are each derived from different molecular species in said ancestral polynucleotide collection;
Wherein said collection of ancestral polynucleotides preferably comprises a plurality of non-identical but potentially related progeny polynucleotides, as exemplified by the collection of genes encoding dehalogenases;
Further here, the one multi-attached nucleic acid strand and the two single-attached nucleic acid strands each have a sequence at least 7 nucleotides in length, identical to the ancestral polynucleotide from which they are derived;
(B) the non-hybridized single-stranded end of the annealed single-bonded nucleic acid strand in the hetero complex is subjected to exonuclease treatment to decompose the non-hybridized single-stranded end; ,
This allows the annealing of the working multiple binding strand and the single binding strand from the non-identical polynucleotide to subsequently cause chimerization of said non-identical polynucleotide;
Thus, in the library of annealed nucleic acid strand complexes, many component strands have non-hybridizable ends that are not optimal or useless for priming polymerase-based extension, ; And
This removes such non-hybridizable ends by exonuclease treatment and converts the annealed nucleic acid strand complex to a primer more suitable for polymerase-based extension;
The method comprising:
[0040]
In a preferred aspect of this embodiment, the present invention is a method of generating a mutated progeny polynucleotide from a collection of ancestral polynucleotides, comprising the following step (c):
(C) subjecting the annealed heterocomplex to polymerase-based extension;
Is provided, further comprising:
[0041]
In another preferred aspect of this embodiment, the present invention is a method of generating a mutated progeny polynucleotide from a collection of ancestral polynucleotides, comprising the following step (d):
(D) subjecting the annealed nucleic acid strand to ligase treatment;
Thus, the ligase treatment is subject to T4 DNA ligase treatment to achieve intermolecular ligation between the two annealed single binding strands, thereby forming a covalently linked chimerized strand. Exemplified by:
Providing the above method, further comprising:
[0042]
In yet another preferred aspect of this embodiment, the invention is a method of generating a mutated progeny polynucleotide from a collection of ancestral polynucleotides, comprising the following step (e):
(E) separating a poly-binding nucleic acid strand from the linked mono-binding nucleic acid strand;
Thereby, separation of the multi-attached nucleic acid strand from the linked single-attached nucleic acid strand to which the multi-attached nucleic acid strand has been annealed can be achieved, for example, by either denaturation or exposure to an enzymatic activity that acts selectively on the multi-attached nucleic acid strand. Can be achieved by:
Providing the above method, further comprising:
[0043]
In yet another preferred aspect of this embodiment, the invention is a method of producing a mutated progeny polynucleotide from a collection of ancestral polynucleotides, comprising the following step (f):
(F) generating a nucleic acid strand complementary to the linked single binding nucleic acid strand;
Thereby, the resulting product consists of a double-stranded mutated progeny polynucleotide;
Providing the above method, further comprising:
[0044]
In yet another preferred aspect of this embodiment, the invention provides a method of producing a mutated progeny polynucleotide from a collection of ancestral polynucleotides, wherein the mutated progeny polynucleotide is a gene or gene pathway. One such method is provided.
[0045]
In yet another preferred aspect of this embodiment, the present invention relates to a method of producing a mutated progeny polynucleotide from a collection of ancestral polynucleotides, comprising the steps of: Wherein said expression results in the production of a polypeptide product that can be detected by expression screening.
[0046]
In a preferred embodiment, (e.g., from the parent polynucleotide template)-in what is termed "codon site saturation mutagenesis"-a progeny generation of polynucleotides, wherein each of the polynucleotides comprises all codons ( Alternatively, at least one set and no more than three adjacent point mutations (ie, different bases containing the novel codon) such that the entire family of degenerate codons encoding the same amino acid are presented at each codon position. ) Is generated. A set of progeny polypeptides, each having at least one single amino acid point mutation, is generated corresponding to the polynucleotide of the progeny generation and as encoded by the polynucleotide of the progeny generation. In a preferred embodiment,-in what is termed "amino acid site saturation mutagenesis"-at each and every amino acid position along the polypeptide, there are 19 naturally encoded polypeptide-forming α-amino acid substitutions. One mutant polypeptide is provided for each. This allows-at each and every amino acid position along the parent polypeptide-a total of 20 different progeny polypeptides, including the original amino acid, or in place of the 20 naturally encoded amino acids, or In addition, if another amino acid is used, more than 21 different progeny polypeptides may be obtained.
[0047]
Thus, in another embodiment, the method comprises:-in addition to and / or in combination with the twenty naturally-occurring polypeptide-forming amino acids described above-other rare and / or naturally occurring It can be used to generate mutants that include uncoded amino acids and amino acid derivatives. In yet another aspect, the method also includes (eg, in a host cell having one or more modified tRNA molecules)-in addition to and / or in addition to a suitable host native or unmodified codon recognition system. Combinations-can also be used to generate mutants by using a modified codon recognition system, a mutant codon recognition system and / or a design codon recognition system.
[0048]
In yet another aspect, the present invention relates to polynucleotides encoding polypeptides by methods of recombination, more particularly, in vivo re-association of polynucleotide sequences comprising partially homologous regions. Preparing, reassembling the polynucleotides to form at least one polynucleotide, and screening the polynucleotides for production of a polypeptide having useful properties.
[0049]
In yet another preferred embodiment, the invention allows the effect of any mutagenic changes achieved, particularly including saturation mutagenesis,-by any molecular property (eg, enzymatic activity) or by current techniques For different combinations of properties-can be used for analysis and classification. Thus, a comprehensive method is provided for examining the effect of changing each amino acid in the parent polypeptide to each of at least 19 possible substitutions. This allows each amino acid in the parent polypeptide to be characterized and classified according to the range of potential effects on the measurable properties of the polypeptide.
[0050]
In another embodiment, the methods of the invention mediate reductive processes that rejoin molecules and / or reduce the complexity of the sequence and the extent of repetitive or contiguous sequences having homologous regions. Utilizes the natural characteristics of cells.
[0051]
It is an object of the present invention to provide a method for producing a hybrid polynucleotide encoding a biologically active hybrid polypeptide with increased activity. According to one aspect of the present invention, to achieve these and other objects, a method for introducing a polynucleotide into a suitable host cell and growing the host cell under conditions that produce a hybrid polynucleotide. Is provided.
[0052]
In another aspect of the invention, the invention provides a method for screening a biologically active hybrid polypeptide encoded by a hybrid polynucleotide. This method allows for the identification of biologically active hybrid polypeptides having increased biological activity.
[0053]
Other objects, features and advantages of the present invention will be apparent to one skilled in the art from the following detailed description. However, while the following detailed description and specific examples illustrate preferred embodiments of the present invention, they are provided for illustrative purposes only. Because various changes and modifications within the spirit and scope of the present invention will become apparent to those skilled in the art from the detailed description herein.
[0054]
In certain embodiments, the present invention provides a method for making and isolating a library of progeny polynucleotides having at least one desired property, comprising:
(A) creating a set of progeny polynucleotides by subjecting the set of starting or parent polynucleotides to a mutagenesis process;
(B) selecting a desired subset of progeny polynucleotides by subjecting this set of progeny polynucleotides to a screening and enrichment process based on end selection;
Thereby, the above steps can be performed iteratively and in any order and combination;
This makes the ends compatible for ligation by a process based on end selection;
This allows one or more intermolecular linkages (preferably, within members of a set of progeny polynucleotides to be made, optionally using the creation of ligation compatible ends to achieve assembly and / or reassembly mutagenesis). Promotes a directional connection);
This makes the ligation compatible end creation help facilitate ligation and expression cloning of the set of progeny polynucleotides into an expression vector system;
This allows for a mutagenesis process (eg, non-stochastic polynucleotide site saturation mutagenesis) through a screening and enrichment process based on end selection.TM) And non-stochastic polynucleotide reassembly (GeneReassembly)TM)) Makes it possible to produce a library of progeny polynucleotides generated by the method;
Thereby, expression cloning of said set of progeny polynucleotides serves to generate a set of full length polypeptides;
This allows the resulting set of polypeptides to be subjected to an expression screening process; and
Thus, expression screening of a set of progeny polypeptides provides a means to identify a desired molecular species (eg, a mutant polypeptide or polypeptide fragment) having the desired properties (eg, specific enzymatic activity);
The method comprises:
[0055]
In another specific embodiment, the invention is a method for making and isolating a library of progeny polynucleotides having at least one desired property, comprising:
(A) creating a set of progeny polynucleotides by subjecting the set of starting or parent polynucleotides to a mutagenesis process;
(B) selecting a desired subset of progeny polynucleotides by subjecting this set of progeny polynucleotides to a screening and enrichment process based on end selection;
This allows the above steps to be performed iteratively and in any order and combination;
This makes the ends compatible for ligation by a process based on end selection;
This allows one or more intermolecular linkages (preferably, within members of a set of progeny polynucleotides to be made, optionally using the creation of ligation compatible ends to achieve assembly and / or reassembly mutagenesis). Promotes a directional connection);
This allows for a mutagenesis process (eg, non-stochastic polynucleotide site saturation mutagenesis) through a screening and enrichment process based on end selection.TM) And non-stochastic polynucleotide reassembly (GeneReassembly)TM)) Makes it possible to produce a library of progeny polynucleotides generated by the method;
Thereby, expression cloning of said set of progeny polynucleotides serves to generate a set of full length polypeptides;
This makes the ligation compatible end creation help facilitate ligation and expression cloning of the set of progeny polynucleotides into an expression vector system;
This allows the resulting set of polypeptides to be subjected to an expression screening process; and
Thus, expression screening of a set of progeny polypeptides provides a means to identify a desired molecular species (eg, a mutant polypeptide or polypeptide fragment) having the desired properties (eg, specific enzymatic activity);
The method comprises:
[0056]
In certain aspects of this embodiment, the present invention is a method as described above wherein the mutagenesis process of step (a) is such that the entire range of single amino acid substitutions from the codon-containing parent polypeptide template is each Consisting of a process called saturation mutagenesis to produce a set of progeny polypeptides represented by amino acid positions,
(A) {generating a set of progeny polynucleotides by subjecting the working codon-containing template polynucleotide to polymerase-based amplification using a degenerate oligonucleotide for each codon to be mutated, wherein: Each of the degenerate oligonucleotides comprises a first homologous sequence and a degenerate triplet sequence;
Here, the degenerate triplet sequence is i) N, N, N, ii) N, N, G / T, iii) N, N, G / C, iv) N, N, C / G / T, v) N , N, A / G / T, vi) N, N, A / C / T, vii) N, N, A / C / G, and viii) from any degenerate codon encoding all 20 amino acids Selected from the group consisting of
b) subjecting the set of progeny polynucleotides to recombinant expression to produce a polypeptide encoded by the progeny polynucleotide;
Including
Thereby, the steps can be performed iteratively and in any order, combination, and
Thus, since the degeneracy of the triplet sequence involves codons of all 20 amino acids, the method provides a means to effect a change of all 20 amino acids at each amino acid site along the parent polypeptide template.
[0057]
In certain aspects of this embodiment, the present invention further provides the method as described above, wherein the mutagenesis process of step (a) is referred to as synthetic ligation gene reassembly or simple synthetic ligation gene reassembly. The method comprises:
[0058]
Definition of terms
Certain frequently used methods and / or terms are described to facilitate an understanding of the embodiments described herein.
[0059]
The term “agent” as used herein, refers to a compound, a mixture of compounds, an array of spatially localized compounds (eg, a VLSIPS peptide array), a polynucleotide array, and / or Combinatorial small molecule arrays), biological macromolecules, bacteriophage peptide display libraries, bacteriophage antibody (eg, scFv) display libraries, polysome peptide display libraries, or biological materials, such as bacterial cells, plant cells, fungal cells, Or an extract from animal (particularly mammalian) cells or tissues. Agents are evaluated for potential activity as anti-tumor, anti-inflammatory or apoptosis modulators by incorporation into the screening assays described below. An agent, when incorporated into a screening assay described below, selectively inhibits a specific protein interaction inhibitor (ie, a binding interaction between two predetermined polypeptides, but substantially interferes with cell survival). (No active agent).
[0060]
An "ambiguous base requirement" at a restriction site is not fully specified, i.e., one specific base (for example, but not limited to, selected from A, C, G and T) Rather than a particular base), but rather a nucleotide base requirement that can be any one of at least two or more bases. The generally accepted abbreviations used in the art and herein to indicate base ambiguity are: R = G or A; Y = C or T; M = A or C; K S = G or C; W = A or T; H = A or C or T; B = G or T or C; V = G or C or A; D = G or A or T; = A or C or G or T.
[0061]
The term "amino acid" as used herein refers to an amino group (-NH2) And a carboxyl group (-COOH), preferably as free radicals or after condensation as part of a peptide bond. “20 naturally occurring α-amino acids that form the encoded polypeptide” are known in the art and include alanine (ala or A), arginine (arg or R), asparagine (asn or N), Aspartic acid (asp or D), cysteine (cys or C), glutamic acid (glu or E), glutamine (gln or Q), glycine (gly or G), histidine (his or H), isoleucine (ile or I), Leucine (leu or L), lysine (lys or K), methionine (met or M), phenylalanine (phe or F), proline (pro or P), serine (ser or S), threonine (thr or T), tryptophan (Trp or W), tyrosine (tyr or Y), And it refers to a valine (val or V).
[0062]
The term "amplification" means that the copy number of a polynucleotide is increased.
[0063]
The term "antibody" as used herein refers to intact immunoglobulin molecules, as well as Fab, Fab ', (Fab')2, Fv and SCA fragments means fragments of an immunoglobulin molecule capable of binding to an epitope of an antigen. These antibody fragments retain some ability to selectively bind to the antigen (eg, a polypeptide antigen) of the antibody from which the fragment was derived and can be made using methods known in the art (eg, Harlow and Lane, supra). The fragment is further described as follows.
[0064]
(1) The Fab fragment is composed of a monovalent antigen-binding fragment of an antibody molecule, and can be prepared by digesting the whole antibody molecule with a papain enzyme to obtain a fragment comprising an intact L chain and a part of an H chain. .
[0065]
(2) The Fab 'fragment of the antibody molecule can be obtained by treating the whole antibody molecule with pepsin and reducing it to obtain a complete molecule consisting of the L chain and a part of the H chain. Two Fab 'fragments are obtained per antibody molecule treated in this manner.
[0066]
(3) Antibody (Fab ')2Fragments can be obtained by treating the entire antibody molecule with a pepsin enzyme and then not reducing. (Fab ')2Fragments are dimers consisting of two Fab 'fragments constrained to each other by two disulfide bonds.
[0067]
(4) An Fv fragment is defined as a fragment that has been genetically engineered and contains an L chain variable region and an H chain variable region expressed as two chains.
[0068]
(5) Single-chain antibodies ("SCAs") are genetically engineered single-chain molecules comprising an L-chain variable region and an H-chain variable region linked by a suitable flexible polypeptide linker. is there.
[0069]
A molecule having “chimeric properties” is 1) partially homologous and partially heterologous to a first reference molecule; 2) at the same time partially homologous to a second reference molecule, 3) a molecule that is at the same time partially homologous to one or more additional reference molecules and does not exclude the possibility of being partially heterologous. In one non-limiting embodiment, a chimeric molecule can be prepared by assembling a recombination of partial molecular sequences. In one non-limiting embodiment, a chimeric polynucleotide molecule can be prepared by synthesizing a chimeric polynucleotide using multiple molecular templates, and the resulting chimeric polynucleotide is characterized by multiple template properties. have.
[0070]
The term "cognate", as used herein, means a gene sequence that is evolutionarily and functionally related between species. For example, but not by way of limitation, in the human genome, the human CD4 gene is a cognate gene to the mouse 3d4 gene. Because the sequence and structure of these two genes indicate that they are quite homologous, and that both genes function in signaling of T cell activation by MHC class II restricted antigen recognition. Because it encodes a protein that
[0071]
By "comparison window" as used herein is meant a conceptual segment of at least 20 contiguous nucleotide positions, where a polynucleotide sequence is a reference consisting of at least 20 contiguous nucleotides. The portion of the polynucleotide sequence that can be compared to a sequence and that is included in the comparison window is compared to a reference sequence (which does not include additions or deletions) in an optimal alignment of the two sequences. Additions or deletions (ie, gaps) can be less than 20 percent. Optimal alignment of sequences for aligning comparison windows is described in Smith's local homology algorithm (Smith and Waterman, Adv Appl. Math., 1981; Smith and Waterman, J Teor Biol, 1981; Smith and Waterol, 1981; Smith et al., J Mol Evol, 1981), Needleman's homology alignment algorithm (Needleman and Wuncsch, 1970), Pearson's similarity search method (Pearson and Lipman, 1988), and computer implementations of these algorithms (GAP, BESTF). , FASTA, and TFASTA (Wisco sin Genetics Software Package Release 7.0, Genetics Computer Group, 575 Science Dr., Madison, WI) or by inspection and optimal alignment over the entire window made by various methods, i.e., by comparison. Which gives the highest percentage of homology).
[0072]
As used herein, the terms "complementarity determining region" and "CDR" refer to, for example, the definitions of the CDRs of Kabat and Chothia et al., Also commonly known as hypervariable regions or hypervariable loops (Chothia and Lesk, 1987; Clothia et al., 1989; Kabat et al., 1987; and Tramontano et al., 1990). The variable region domains generally comprise about 105 to 115 amino acids amino-terminal to the native immunoglobulin chain (eg, amino acids 1-110), although somewhat shorter or longer variable domains will form single-chain antibodies. Suitable for.
[0073]
"Conservative amino acid substitution" refers to the interchangeability of residues having similar side chains. For example, a group of amino acids having an aliphatic side chain is glycine, alanine, valine, leucine and isoleucine; a group of amino acids having an aliphatic hydroxyl side chain is serine and threonine; a group of amino acids having an amide containing side chain Are asparagine and glutamine; groups of amino acids having aromatic side chains are phenylalanine, tyrosine and tryptophan; groups of amino acids having basic side chains are lysine, arginine and histidine; amino acids having sulfur-containing side chains Are cysteine and methionine. Preferred conservative amino acid substitution groups are valine-leucine-isoleucine, phenylalanine-tyrosine, lysine-arginine, alanine-valine, and asparagine-glutamine.
[0074]
The term "corresponding to" as used herein refers to a polynucleotide sequence that is homologous (ie, identical but not strictly evolutionarily related) to all or a portion of a reference polynucleotide sequence. Or that the polypeptide sequence is identical to the reference polypeptide sequence. On the other hand, the term "complementary to" as used herein means that the complementary sequence is homologous to all or a portion of a reference polynucleotide sequence. By way of example, the nucleotide sequence "TATAC" corresponds to the reference sequence "TATAC" and is complementary to the reference sequence "GTATA".
[0075]
The term "degradative effective amount" means the amount of enzyme required to treat at least 50% of the substrate as compared to the substrate that has not been contacted with the enzyme. Preferably, at least 80% of the substrate is degraded.
[0076]
As used herein, the term "determined sequence framework" refers to a set of defined sequences that are selected on a non-random basis, generally based on experimental or structural data, e.g., The framework may comprise a set of amino acid sequences predicted to form a β-sheet structure, or in particular, a leucine zipper heptad repeat motif, a zinc finger domain. A "determined sequence nucleus" is a set of sequences containing limited diversity. (1) A completely random 10-mer sequence consisting of 20 ordinary amino acids is represented by (20)10And (2) a pseudo-random 10-mer sequence consisting of 20 ordinary amino acids: (20)10While (3) the nucleus of the definitive sequence is such that each residue position has a specific position and / or bias for a particular residue in the whole. A subset of the sequence where it can be any of the 20 acceptable normal amino acids (and / or an acceptable unusual amino / imino acid). The nucleus of the definitive sequence is generally a variable and invariant residue position, and / or a residue selected from a definitive subset of amino acid residues, over a portion or the entire length of the member sequence of an individual selected library. Includes variable residue positions that can include groups, and the like. The nucleus of a definitive sequence refers to an amino acid sequence or a polynucleotide sequence. For example, but not by way of limitation, the sequence (NNK)10And (NNM)10(Where N is A, T, G or C, K is G or T and M is A or C) is the nucleus of the definitive sequence.
[0077]
"Digestion" of DNA refers to catalytic cleavage of the DNA with a restriction enzyme that acts only at certain sequences in the DNA. The various restriction enzymes used herein are commercially available and their reaction conditions, cofactors and other requirements are used as known to those skilled in the art. For analytical purposes, generally 1 μg of plasmid or DNA fragment is used with about 2 units of enzyme in about 20 μl of buffer solution. For the purpose of isolating DNA fragments for plasmid construction, generally 5 to 50 μg of DNA are digested in large volumes with 20 to 250 units of enzyme. Suitable amounts of buffer and substrate for a particular restriction enzyme are specified by the manufacturer. Typically, the incubation time is about 1 hour at 37 ° C, but can vary depending on the supplier's instructions. After digestion, the reaction is electrophoresed directly on a gel to isolate the desired fragment.
[0078]
"Directional ligation" refers to ligation in which the 5 'and 3' ends of the polynucleotide are sufficiently different to specify a preferred ligation orientation. For example, a PCR product with two blunt ends, especially untreated and digested, will generally have a favorable ligation orientation when ligated to a cloning vector that has been digested to provide blunt ends at its multiple cloning site. Thus, in general, directional ligation is not presented under these circumstances. In contrast, when a digested PCR product having 5 ′ EcoRI-treated ends and 3 ′ BamHI treated ends is ligated to a cloning vector having a multiple cloning site digested with EcoRI and BamHI, directional ligation generally occurs. Presented.
[0079]
The term "DNA shuffling," as used herein, refers to recombination between substantially homologous, but non-identical sequences, and in some embodiments, DNA shuffling refers to cer / lox and And / or crossover by non-homologous recombination, such as the flp / frt system.
[0080]
As used herein, the term "epitope" refers to an antigenic determinant of an antigen, such as a phytase peptide, to which a paratope of an antibody, such as a phytase-specific antibody, binds. Antigenic determinants usually consist of a chemically active surface configuration of molecules such as amino acids or sugar side chains and can have specific three-dimensional structural characteristics as well as specific charge characteristics. As used herein, "epitope" means a portion of an antigen or other macromolecule capable of forming a binding interaction that interacts with a variable region binding portion of an antibody. Generally, such binding interactions manifest themselves as intermolecular contacts with one or more amino acid residues of a CDR.
[0081]
The terms "fragment," "derivative," and "analog" when referring to a reference polypeptide, include polypeptides that retain at least one biological function or activity that is at least essentially identical to the reference polypeptide. . Furthermore, the term “fragment”, “derivative” or “analog” is exemplified by “pro-type” molecules, such as low-activity proproteins that can be modified by cleavage to produce a mature enzyme with significantly higher activity. .
[0082]
The present invention provides a method for obtaining, from a template polypeptide, a set of progeny polypeptides in which “a whole range of single amino acid substitutions” is displayed at each amino acid position. As used herein, "full range of single amino acid substitutions" refers to the 20 alpha-amino acids that form the naturally encoded polypeptide, as described herein.
[0083]
The term "gene" refers to a segment of DNA involved in the production of a polypeptide chain, including the regions before and after the coding region (leaders and trailers) as well as intervening sequences (introns) between the individual coding segments (exons). .
[0084]
By "gene instability" as used herein is meant the natural tendency for highly repetitive sequences to be lost by a process of truncation events that generally involves sequence simplification due to the lack of repetitive sequences. Deletions tend to involve the deletion of one copy of one repeat and all deletions between repeats.
[0085]
The term "heterologous" means that one single-stranded nucleic acid sequence cannot hybridize to another single-stranded nucleic acid sequence or its complement. Thus, a heterologous region means that the region of the polynucleotide or the polynucleotide has a region within its sequence that is unable to hybridize to another nucleic acid or polynucleotide. Such a region is, for example, a region of mutation.
[0086]
The terms "homologous" or "homogeneity" mean that one single-stranded nucleic acid sequence can hybridize to a complementary single-stranded nucleic acid sequence. The degree of hybridization can depend on a number of factors, including the amount of identity between the sequences and hybridization conditions such as temperature and salt concentration as described below. Preferably, the region of identity is greater than about 5 bp, and more preferably, the region of identity is greater than 10 bp.
[0087]
The light or heavy chain variable region of an immunoglobulin consists of a “framework” region interrupted by three hypervariable regions, also called CDRs. The extent and CDRs of the framework regions have been precisely determined, see "Sequences of Proteins of Immunological Interest" (Kabat et al., 1987). The sequences of the framework regions of the various light or heavy chains are relatively conserved in the same species. As used herein, a "human framework region" is a framework region that is substantially identical (about 85 or more, usually 90-95 or more) to the framework region of a natural human immunoglobulin. The framework regions of the antibody, that is, the framework regions combining the L and H chains of the constituent components, are used for CDR positioning and alignment. CDRs are primarily responsible for binding antigens to epitopes.
[0088]
The advantages of the present invention extend to "industrial applications" (or industrial processes). The term is used to include applications in the commercial industry itself (or simple industry) as well as non-commercial industrial applications (eg, biomedical research in non-profit organizations). Related uses include those in the fields of diagnostics, medicine, agriculture, manufacturing and academia.
[0089]
The term "identical" or "identity" means that two nucleic acid sequences have identical or complementary sequences. Thus, "identity region" means that a region of a polynucleotide or the entire polynucleotide is the same or complementary to a region of another polynucleotide or the polynucleotide.
[0090]
The term "isolated" means removed from its original environment (eg, its natural environment, if it is a natural product). For example, a natural polynucleotide or enzyme present in a living animal has not been isolated, but the same polynucleotide or enzyme isolated from some or all of the coexisting materials in the natural system has been isolated. . Such a polynucleotide may be part of a vector, and / or such a polynucleotide or enzyme may be part of a composition. Further, such a vector or composition may be isolated when it is not part of its natural environment.
[0091]
An “isolated nucleic acid” is a nucleic acid, such as a DNA or RNA molecule, that is not adjacent to 5 ′ and 3 ′ flanking sequences that are normally immediately adjacent when present in the natural genome of the organism from which it was derived. means. Thus, the term includes, for example, nucleic acids that are integrated into a vector, such as a plasmid or viral vector; nucleic acids that are integrated into the genome of a heterologous cell (or a site that is different from the natural site in the case of the genome of a homologous cell). And nucleic acids which are present as isolated molecules, such as DNA fragments produced by PCR amplification or restriction enzyme digestion or RNA molecules produced by in vitro transcription. The term also describes a recombinant nucleic acid that forms part of a hybrid gene encoding another polypeptide sequence that can be used, for example, to produce a fusion protein.
[0092]
As used herein, "ligand" refers to a molecule, such as a random peptide or variable segment sequence, that is recognized by a particular receptor. As will be appreciated by those skilled in the art, the molecule (or macromolecular complex) can be a receptor or a ligand. In general, smaller molecular weight binding partners are called ligands, and larger molecular weight binding partners are called receptors.
[0093]
"Ligation" refers to the process of forming a phosphodiester bond between two double-stranded nucleic acid fragments (Sambrook et al., 1982, p. 146; Sambrook, 1989). Unless otherwise indicated, ligation can be performed using a known buffer and using 10 units of T4 DNA ligase (“ligase”) per 0.5 μg containing approximately equimolar amounts of the DNA fragments to be ligated. it can.
[0094]
As used herein, a “linker” or “spacer” refers to a molecule or group of molecules that connects two molecules, for example, a DNA binding protein and a random peptide, and combines the two molecules in a preferred configuration, for example, It helps to position the random peptide so that it can bind to the receptor with minimal steric hindrance due to the DNA binding protein.
[0095]
"Molecular properties to be evolved", as used herein, refers to a molecule composed of a polynucleotide sequence, a molecule composed of a polypeptide sequence, partially including a polynucleotide sequence, and partially including a polypeptide sequence. Including molecules related to Examples of particularly relevant (but not limiting) molecular properties to be evolved include specific conditions such as temperature, salinity, pressure, pH and glycerol, DMSO, surfactants and / or reaction environments. Enzyme activity under conditions such as the concentration of any other molecular species to be contacted. Another particularly relevant (but not limiting) example of the molecular properties to be evolved are stability, e.g., residuals present after a certain period of exposure to certain circumstances, such as may occur during storage. The amount of the molecular property to be performed.
[0096]
The term "mutation" means a change in the sequence of a wild-type nucleic acid sequence or a change in the sequence of a peptide. Such a mutation can be a point mutation, such as a transition or transversion. The mutation can be a deletion, insertion or duplication.
[0097]
As used herein, a degenerate "N, N, G / T" nucleotide sequence indicates that 32 triplets are possible, where "N" can be A, C, G or T. .
[0098]
The term "natural" as used herein with respect to an object refers to the fact that the object is found in nature. For example, a polypeptide or polynucleotide sequence that is present in an organism (eg, a virus) that can be isolated from a natural source and that has not been intentionally modified by a human in the laboratory is natural. Generally, the term natural refers to an object that is present in a non-diseased (non-diseased) individual, eg, as is typical for that species.
[0099]
As used herein, a "nucleic acid molecule" consists of at least one base or one base pair (depending on whether it is single-stranded or double-stranded, respectively). Further, the nucleic acid molecule may belong exclusively to any group of nucleotide-containing molecules, or may belong to a chimera. The nucleotide containing molecules are exemplified by, but not limited to, the following group of nucleic acid molecules: RNA, DNA, genomic nucleic acid, non-genomic nucleic acid, natural nucleic acid and non-naturally occurring nucleic acid, And synthetic nucleic acids. The nucleotide-containing molecules include, by way of non-limiting example only, related nucleic acids of organelles such as mitochondria, ribosomal RNA, and nucleic acid molecules that chimerically comprise one or more non-natural elements with natural elements.
[0100]
Further, a "nucleic acid molecule" may partially include one or more non-nucleotide based components, exemplified by, but not limited to, amino acids and carbohydrates. Thus, by way of example, and not limitation, ribozymes that are partially nucleotide-based and partially protein-based are considered "nucleic acid molecules."
[0101]
Also, by way of example, and not limitation, a nucleic acid molecule labeled with a detectable moiety (eg, a radioactive label or, alternatively, a non-radioactive label) is also considered a “nucleic acid molecule”.
[0102]
The terms "nucleic acid sequence encoding (specific enzyme)" or "DNA encoding sequence of (specific enzyme)" or "nucleotide sequence encoding (specific enzyme)" and other synonyms are defined as A DNA sequence that is transcribed and translated into an enzyme when placed under the control of appropriate regulatory sequences. A "promoter sequence" is a DNA regulatory region capable of binding RNA polymerase in a cell and initiating transcription of a downstream (3 'direction) coding sequence. A promoter is a part of a DNA sequence. This sequence region has an initiation codon at its 3 'end. The promoter sequence contains a minimal number of bases with the necessary components to initiate transcription at a detectable level above background. However, after RNA polymerase binds to the sequence and transcription is initiated at the initiation codon (3 'end of the promoter), transcription proceeds downstream in the 3' direction. Within the promoter sequence will be found a transcription initiation site (successfully defined by mapping with S1 nuclease), and a protein binding domain (consensus sequence) responsible for the binding of RNA polymerase.
[0103]
The terms “nucleic acid encoding an enzyme (protein)” or “DNA encoding an enzyme (protein)” or “polynucleotide encoding an enzyme (protein)” and other equivalent terms refer to a sequence encoding the enzyme. Not only polynucleotides comprising only coding sequences, but also polynucleotides comprising additional coding or non-coding sequences.
[0104]
In one preferred embodiment, the "specific nucleic acid species" is that which is defined by, but not limited to, its chemical structure, as exemplified by the primary sequence. In another preferred embodiment, a particular “nucleic acid species” is defined by the function of the nucleic acid species or the function of the product derived from the nucleic acid species. Thus, by way of non-limiting example only, a “specific nucleic acid species” is defined by one or more activities or properties attributable thereto, including activities or properties attributable to its expression product.
[0105]
The definition herein of “assembly of an active nucleic acid sample into a nucleic acid library” is defined as the step of incorporating a nucleic acid sample into a vector-based collection (eg, by ligation into a vector and transforming a host). including. A description of suitable vectors, hosts, and other reagents, as well as specific, non-limiting examples thereof, follows. The definition herein of "assembly of an active nucleic acid sample into a nucleic acid library" also includes incorporating the nucleic acid sample into a non-vector-based collection (eg, by ligation with an adapter). Preferably, the adapter anneals to a PCR primer and can promote amplification by PCR.
[0106]
Thus, in a non-limiting embodiment, a "nucleic acid library" encompasses a collection of one or more nucleic acid molecules based on a vector. In a different preferred embodiment, a "nucleic acid library" comprises a collection of nucleic acid molecules based on non-vectors. In yet a different preferred embodiment, a "nucleic acid library" encompasses a hybrid collection of nucleic acid molecules, based in part on vectors and in part on non-vectors. Preferably, the molecular collections that make up the library are searchable and separable for each nucleic acid molecular species.
[0107]
The present invention provides "nucleic acid constructs" or "nucleotide constructs" or "DNA constructs." The term "construct" as used herein describes a molecule, such as, for example, a polynucleotide (eg, a phytase polynucleotide), which can optionally be chemically linked to one or more additional molecular moieties, such as a vector or a portion of a vector. Used for In a specific, but not limiting, embodiment, the nucleotide construct is exemplified by a DNA expression construct suitable for transforming a host cell.
[0108]
"Oligonucleotide" (or synonymously "oligo") refers to a single-stranded or complementary double-stranded polydeoxynucleotide, which may be chemically synthesized. Some such synthetic oligonucleotides have a 5 'phosphate group, while others do not. Those having no 5 'phosphate group are not linked to other oligonucleotides unless a phosphate group is added by ATP in the presence of a kinase. The synthetic oligonucleotide is ligated to a fragment that has not been dephosphorylated. To achieve polymerase-based amplification (eg, by PCR), "in order comprising at least a first homologous sequence, a degenerate N, N, G / T sequence, and a second homologous sequence, 32 Oligonucleotides that are doubled ". As used in this context, "homology" refers to the homology between a parent polynucleotide, which is amplified based on a polymerase, and the oligo.
[0109]
The term "operably linked" as used herein refers to the joining of elements of a polynucleotide in a functional relationship. A nucleic acid is “operably linked” when it is placed into a functional relationship with another nucleic acid sequence. For example, a promoter or enhancer is operably linked to a coding sequence if it affects the transcription of the coding sequence. Operably linked means that the linked DNA sequences are typically contiguous, and contiguous and in reading frame if necessary to join the two regions encoding the protein. It means that there is.
[0110]
If RNA polymerase transcribes the two coding sequences into one mRNA, and then the mRNA is translated into one polypeptide containing amino acid sequences derived from both coding sequences, the coding sequence will become another coding sequence. "Operably linked". The coding sequences need not be contiguous with each other, provided that the sequences to be expressed are processed to ultimately produce the desired protein.
[0111]
As used herein, the term “parent polynucleotide set” is a set that includes one or more different polynucleotide species. Usually the term is used preferably in connection with a set of progeny polynucleotides, preferably obtained by mutagenesis of the parent set, wherein the terms "parent", "starting" and "template" can be used interchangeably.
[0112]
As used herein, the term "physiological conditions" refers to the temperature, pH, conditions that are compatible with living organisms and / or are typically present intracellularly in living yeast cells or living mammalian cells in culture. , Ionic strength, viscosity, and similar biochemical parameters. For example, the intracellular conditions in yeast cells grown under typical laboratory culture conditions are physiological conditions. Suitable in vitro reaction conditions for the transcription cocktail in vitro are generally physiological conditions. In general, in vitro physiological conditions include 50-200 mM NaCl or KCl, pH 6.5-8.5, 20-45 ° C., and 0.001-10 mM divalent cations (eg, Mg2+, Ca2+); Preferably containing about 150 mM NaCl or KCl, pH 7.2-7.6, 5 mM divalent cation, and more often 0.01-1.0% non-specific protein (eg, BSA). Nonionic surfactants (Tween, NP-40, Triton X-100) are often present, usually at about 0.001-2%, typically 0.05-0.2% (v / v). . Particular aqueous conditions can be selected by those skilled in the art according to conventional methods. As a general guide, the following buffered aqueous conditions can be applied: 10-250 mM NaCl, 5-50 mM Tris HCl, pH 5-8, and optionally a divalent cation and / or metal chelator and / or non-ionic Contains surfactants and / or membrane fractions and / or antifoams and / or scintillants.
[0113]
Standard rules (5 'to 3') are used herein to describe the sequence of the double-stranded polynucleotide.
[0114]
The term "group" as used herein refers to a collection of components such as, for example, a polynucleotide, a portion of a polynucleotide, or a protein. A “mixed group” is a component that belongs to the same family of nucleic acids or proteins (ie, is closely related), but differs in sequence (ie, is not identical), and thus has different biological activities. Means a collection.
[0115]
A molecule having a "pro form" is defined as a covalent and non-covalent form on the way to a more mature molecular form that has a difference in properties (eg, increased activity) as compared to the reference pro form molecule. (Eg, glycosylation, proteolytic cleavage, dimerization or oligomerization, temperature- or pH-induced conformational changes, binding to cofactors, etc.) in any combination of one or more. Say the numerator. If two or more chemical modifications (eg, two proteolytic cleavages, or proteolytic cleavage and deglycosylation) can be distinguished during the production of the mature molecule, the reference precursor molecule is a “prepro-type”. "Molecules.
[0116]
As used herein, the term "pseudo-random" refers, for example, to a degree of residue variability at a site other than the pseudo-random site, where some degree of residue variability is allowed but limited. , For a series of sequences with limited variability.
[0117]
As used herein, "pseudo-repeat unit" refers to a repetitive sequence that is recombined, but is not identical by definition. In fact, not only for substantially identical coding units generated by mutagenesis of the same starting sequence, but also for recombination of similar or closely related sequences that are quite different in some regions. The scheme is brought out. Nevertheless, if the sequences have sufficient homology to be recombined by this approach, they can be referred to as "quasi-repeated" units.
[0118]
As used herein, the term "random peptide library" refers to a set of polynucleotide sequences encoding a set of random peptides, and a set of random peptides encoded by those polynucleotide sequences, and those random peptides. Refers to a set of fusion proteins containing
[0119]
As used herein, “random peptide sequence” refers to an amino acid sequence that contains two or more amino acid monomers and is constructed by a stochastic or random method. Random peptides may include framework motifs or scaffold motifs which may include invariant sequences.
[0120]
As used herein, "receptor" refers to a molecule that has an affinity for a particular ligand. Receptors can be natural or synthetic molecules. The receptor can be used in an invariant state or as an association with another species. The receptor may be covalently or non-covalently associated with the binding member, either directly or via a specific binding substance. Examples of receptors include, but are not limited to, monoclonal antibodies and antibodies, including antisera reactive with particular antigenic determinants (eg, on viruses, cells, or other substances), and cell membrane receptors , Glycoconjugates and glycoproteins, enzymes, and hormone receptors.
[0121]
"Recombinant" enzyme refers to an enzyme produced by recombinant DNA technology, ie, an enzyme produced from cells transformed with an exogenous DNA construct encoding the desired enzyme. "Synthetic" enzymes are those made by chemical synthesis.
[0122]
The term "related polynucleotide" means that certain regions or ranges of a polynucleotide are the same, and certain regions or ranges of the polynucleotide are heterologous.
[0123]
As used herein, "decreasing recombination" refers to an increase in molecular diversity that occurs through deletion (and / or insertion) events mediated by repetitive sequences.
[0124]
The following terms are used to describe the sequence relatedness between two or more polynucleotides: "reference sequence," "comparison window," "sequence identity," "percentage of sequence identity," and "substantial identity." ".
[0125]
A “reference sequence” is a definitive sequence used as a basis for sequence comparison. The reference sequence may be a subsequence of a larger sequence, such as a segment of the full-length cDNA or gene sequence listed in the sequence listing, or may include the complete cDNA or gene sequence. Generally, a reference sequence is at least 20 nucleotides in length, often at least 25 nucleotides in length, and often at least 50 nucleotides in length. The two polynucleotides each (1) contain a similar sequence between the two polynucleotides (ie, a portion of the complete polynucleotide sequence), and (2) differ between the two polynucleotides. The sequence comparison between the two (or more) polynucleotides typically involves comparing the sequences of the two polynucleotides over a "comparison window", since the sequences further include the This can be done by identifying and comparing the identified local regions.
[0126]
As used herein, "repeat index (RI)" is the average number of copies of a pseudo-repeat unit included in a cloning vector.
[0127]
The term "restriction site" refers to a recognition sequence that is necessary for a restriction enzyme to function, and that contains a catalytic cleavage site. It is understood that the cleavage site may or may not be included in a portion of the restriction site that includes a less ambiguous sequence (ie, a sequence that includes a major determinant of the frequency of occurrence of the restriction site). . Thus, in many cases, suitable restriction sites are those that include only low ambiguity sequences that have an internal cleavage site (eg, G / AATTC for an EcoRI site) or an immediately adjacent cleavage site (eg, / CCWGG for an EcoRII site). . In other cases, a suitable restriction enzyme [eg, an Eco57I site or CTGAAG (16/14)] may have a low ambiguity sequence (eg, a CTGAAG sequence at the Eco57I site) and an external cleavage site (eg, the N at the Eco57I site).16Part). It will be understood that when an enzyme (eg, a restriction enzyme) says "cleaves" a polynucleotide, it means that the restriction enzyme catalyzes or promotes cleavage of the polynucleotide.
[0128]
In one non-limiting embodiment, the “selectable polynucleotide” comprises a 5 ′ terminal region (ie, a terminal region), a middle region (ie, an internal or central region), and a 3 ′ terminal region (ie, a terminal region). ). When used in this embodiment, the 5 'terminal region is a region located in the direction of the 5' polynucleotide end and thus is partially or wholly included in the 5 'half of the polynucleotide. Similarly, a 3 'terminal region is a region located in the direction of the 3' polynucleotide end and thus is partially or wholly included in the 3 'half of the polynucleotide. As shown in the non-limiting examples herein, there can be overlapping sequences between any two regions or even between all three regions.
[0129]
The term “sequence identity” means that the two polynucleotide sequences are identical (ie, on a nucleotide-by-nucleotide basis) over the window of comparison. The term "percent sequence identity" refers to comparing two sequences that are optimally aligned over the entire comparison window and comparing the identity of nucleobases (eg, A, T, C, G, U or I) in both sequences. By determining the number of positions and finding the number of match positions, dividing the number of match positions by the total number of positions in the comparison window (ie, the window size) and multiplying the result by 100 to give the percentage of sequence identity, It is calculated. As used herein, this "substantial identity" refers to one property of a polynucleotide sequence, wherein the polynucleotide is compared to a reference sequence in a comparison window that is at least 25-50 nucleotides. And includes sequences having at least 80% sequence identity, preferably at least 85% identity, often 90-95% sequence identity, and most commonly at least 99% sequence identity. Also, the percentage of sequence identity is calculated by comparing the reference sequence to a polynucleotide that may contain up to 20% or less of the reference sequence in its entirety over the comparison window.
[0130]
As is known in the art, "similarity" between two enzymes is determined by comparing the amino acid sequence of one enzyme and its conserved amino acid substitutions to the sequence of another enzyme. Similarity can be determined by techniques well known in the art, for example, the BLAST program (Basic Local Alignment Search Tool at the National Center for Biological Information).
[0131]
As used herein, the term “single-chain antibody” usually refers to a spacer peptide (eg, [Gly-Gly-Gly-Gly-Ser]).X) At the polypeptide bond, which is preferably viaHDomain and VLRefers to a polypeptide comprising a domain, which may include additional amino acid sequences at the amino and / or carboxyl termini. For example, a single-chain antibody can include a tether segment for linking to the encoding polynucleotide. For example, scFv is a single-chain antibody. In general, single-chain antibodies are essentially encoded by genes of the immunoglobulin superfamily (see, for example, Williams and Barclay, 1989, pp. 361-368, which is incorporated herein by reference). At least 10 contiguous sequences encoded by the gene sequence of a rodent, non-human primate, bird, pig, cow, sheep, goat, or human heavy or light chain A protein consisting of one or more polypeptide segments of amino acids. Functional single chain antibodies generally comprise a portion of the immunoglobulin superfamily gene product that is sufficient to maintain binding properties for a particular target molecule, typically a receptor or antigen (epitope).
[0132]
Members of a pair of molecules (eg, an antibody-antigen pair, or a nucleic acid pair) are said to “specifically bind” to each other if they bind to each other with a higher affinity than other non-specific molecules. For example, antibodies raised against an antigen (to which the antibody binds more efficiently than to a non-specific protein) can be described as binding specifically to the antigen. (Similarly, a nucleic acid probe can be described as binding specifically to a nucleic acid target if it forms a specific duplex with a nucleic acid target through base pairing interactions (see above). ).)
"Specific hybridization", as used herein, refers to a first polynucleotide and a second polynucleotide (eg, a polynucleotide that differs from the first polynucleotide but has essentially the same sequence). Is defined as a hybrid between, and essentially unrelated polynucleotide sequences do not hybridize in a mixture.
[0133]
The term “specific polynucleotide” refers to a polynucleotide having a specific end and having a specific nucleic acid sequence. When one polynucleotide has the same sequence as a portion of the other polynucleotide, but has different ends, the two polynucleotides include two different specific polynucleotides.
[0134]
"Stringent hybridization conditions" means that hybridization occurs only when there is at least 90% identity between the sequences, preferably at least 95% identity, and most preferably at least 97% identity. Means when it will happen. See Sambrook et al., 1989. It is incorporated herein by reference in its entirety.
[0135]
Also, polypeptides having a sequence that is "substantially identical" to the sequence of the phytase polypeptide, such as the sequence of SEQ ID NO: 1, are encompassed by the present invention. An “substantially identical” amino acid sequence is a sequence that differs from a reference sequence only by conservative amino acid substitutions. A conservative amino acid substitution is, for example, replacing one amino acid with another of the same class (eg, replacing one hydrophobic amino acid such as isoleucine, valine, leucine, or methionine with another amino acid). Substitution, or substitution of one polar amino acid for another, such as substitution of arginine for lysine, glutamic acid for aspartic acid, or glutamine for asparagine).
[0136]
Further, an "substantially identical" amino acid sequence is a sequence that differs from a reference sequence by one or more non-conservative substitutions, deletions or insertions, particularly where such substitutions Occurs at a site that is not a site, and the polypeptide retains essentially its properties. For example, one or more amino acids may be deleted from a phytase polypeptide, resulting in a change in the structure of the polypeptide but no significant change in its biological activity. For example, amino or carboxyl terminal amino acids that are not required for phytase biological activity can be removed. Such modifications allow the development of smaller active phytase polypeptides.
[0137]
The present invention provides "substantially pure enzymes." The term "substantially pure enzyme" is used herein to refer to a polypeptide (substantially free of other proteins, lipids, carbohydrates, nucleic acids, and other biological materials with which they are naturally present). (Eg, a phytase polypeptide or fragment thereof). For example, a substantially pure molecule (eg, a polypeptide) can contain at least 60% by dry weight of the molecule of interest. The purity of the polypeptide can be measured using standard methods, including, for example, polyacrylamide gel electrophoresis (eg, SDS-PAGE), column chromatography (eg, high performance liquid chromatography (HPLC)), and amino-terminal amino acid sequence analysis. .
[0138]
As used herein, "substantially pure" means that the target species is present as the dominant species (i.e., on a molar basis, the target species is present in the composition in a greater amount than each of the other macromolecular species. (Present), and more preferably, a substantially purified fraction means that the composition is such that the target species consists of at least about 50% (on a molar basis) of all macromolecules present. Generally, a substantially pure composition will comprise more than about 80-90% of all macromolecular species present in the composition. Most preferably, the species of interest is purified until it is essentially homogeneous (contaminant species cannot be detected in the composition with conventional detection methods), the composition consisting essentially of a single macromolecular species. . Solvent species, small molecules (less than 500 daltons) and elemental ionic species are not considered macromolecular species.
[0139]
As used herein, "variable segment" refers to a portion of the initial peptide that contains a random, pseudo-random, or defined nuclear sequence. "Variable segment" refers to a portion of the initial peptide that contains a random, pseudo-random, or defined nuclear sequence. A "variable segment" can include both variable and invariant residue positions, but with a limited degree of residue variability at the variable residue positions. At the discretion of the person skilled in the art, both options are chosen. Typically, the variable segment is about 5-20 amino acid residues in length (e.g., 8-10), but the variable segment may be longer and may include antibody fragments, nucleic acid binding proteins, antibody portions such as receptor proteins, etc. Alternatively, it may include a receptor protein.
[0140]
The term "wild-type" means that the polynucleotide contains no mutations. A "wild-type" protein means that the protein is active at a naturally occurring level of activity and comprises a naturally occurring amino acid sequence.
[0141]
For example, the term "active" in "active sample" simply refers to the sample on which it is active. Similarly, for example, an "active molecule" refers to a molecule that is active.
[0142]
DETAILED DESCRIPTION OF THE INVENTION
The invention described herein provides an iterative cycle of diminishing recombination, recombination and selection that allows for directed molecular evolution through recombination of highly complex linear sequences (such as DNA, RNA or proteins). Intended for use.
[0143]
In vivo shuffling of molecules is accomplished using the natural properties of cells to recompose multimers. In vivo recombination has provided a major natural pathway to molecular diversity, while genetic recombination has the following consequences: 1) homology recognition, 2) strand cleavage, strand invasion and assembly. The metabolic steps leading to the development of recombinant chiasma and finally, 3) remain relatively complex processes involving the separation of chiasma into separate recombinant molecules. The formation of chromosomal crossovers requires recognition of homologous sequences.
[0144]
In a preferred embodiment, the present invention relates to a method for producing a hybrid polynucleotide from at least a first polynucleotide and a second polynucleotide. Using the present invention, hybrid polynucleotides can be made by introducing at least a first polynucleotide and a second polynucleotide that share at least one partial homologous sequence region into a suitable host cell. Partial homologous sequence regions facilitate the process attributable to sequence rearrangement to produce hybrid polynucleotides. As used herein, a "hybrid polynucleotide" is any nucleotide sequence that results from a method of the invention and includes a sequence derived from at least two of the original polynucleotide sequences. Such hybrid polynucleotides can result from the event of intermolecular recombination that promotes sequence integration between DNA molecules. In addition, such hybrid polynucleotides can also result from an intramolecular reductive recombination process that utilizes repetitive sequences to change the nucleotide sequence within a DNA molecule.
[0145]
The present invention provides a means for producing a hybrid polynucleotide capable of encoding a biologically active hybrid polypeptide. In some embodiments, the original polynucleotide encodes a biologically active polypeptide. The method of the present invention produces a novel hybrid polypeptide by utilizing a cellular process. It integrates the original polynucleotide sequence and the resulting hybrid polynucleotide encodes a polypeptide that exhibits activity derived from the original biologically active polypeptide. For example, the original polynucleotide may encode a particular enzyme from a different microorganism. For example, an enzyme encoded by a first polynucleotide from an organism may function effectively under certain environmental conditions, for example, at high salinity. Enzymes encoded by second polynucleotides from different organisms may function effectively under different environmental conditions, such as extremely high temperatures. A hybrid polynucleotide comprising sequences from the original first and second polynucleotides may encode an enzyme that exhibits the properties of both the enzymes encoded by the original polynucleotide. Thus, the enzyme encoded by the hybrid polynucleotide can function effectively under environmental conditions shared by the respective enzymes encoded by the first and second polynucleotides, for example, at high salinity and elevated temperatures.
[0146]
Enzymes encoded by the original polynucleotides of the present invention include, but are not limited to, oxidoreductases, transferases, hydrolases, lyases, isomerases and ligases. The hybrid polypeptide obtained by the method of the present invention may exhibit specialized enzymatic activity not exhibited by the original enzyme. For example, following recombination and / or reducing recombination of a polynucleotide encoding a hydrolase activity, the specialized hydrolase activity obtained from each original enzyme, ie, the binding of the bond on which the hydrolase acts, The resulting hybrid polypeptide encoded by the hybrid polynucleotide can be screened for type and temperature at which the hydrolase functions. Thus, for example, hydrolases are those chemical functionalities that distinguish hybrid hydrolases from the original hydrolase, such as (a) amide (peptide bonds) or proteases, (b) ester bonds or esterases and lipases. , (C) confirm the acetal or glycosidase, as well as, for example, the temperature, pH or salt concentration at which the hybrid polypeptide functions, and screen for hydrolases.
[0147]
The source of the original polynucleotide may be an individual organism ("isolate"), a collection of organisms grown in a given medium ("enriched culture") or, most preferably, an uncultured organism ("environmental Sample "). Most preferably, a polynucleotide encoding a novel biological activity is obtained from an environmental sample using a non-cultivation approach, as this would allow the exploitation of untapped biodiversity resources. .
[0148]
An "environmental library" is created from an environmental sample, which refers to the collective genome of a natural organism, maintained in a cloning vector capable of growing in a suitable prokaryotic host. Because the cloned DNA is initially extracted directly from environmental samples, the library is not limited to a small fraction of prokaryotes that can grow on pure media. In addition, normalizing the environmental DNA present in these samples will allow a more even presentation of DNA from all species present in the original sample. This can greatly increase the efficiency of finding interesting genes from trace components of the sample that are presented several times lower than dominant species.
[0149]
For example, a gene library made from one or more uncultured microorganisms is screened for the activity of interest. First, in prokaryotic cells, potential pathways encoding bioactive molecules of interest are captured in the form of gene expression libraries. A polynucleotide encoding the desired activity is isolated from such a library and introduced into a host cell. The host cells are grown under conditions that promote recombination and / or diminished recombination to create effective biomolecules that may have new or enhanced activity.
[0150]
Microorganisms from which polynucleotides are prepared include prokaryotic microorganisms such as eubacteria and archaebacteria and lower eukaryotic microorganisms such as fungi, some algae and protozoa. A polynucleotide can be isolated from an environmental sample if the nucleic acid can be recovered without culturing the organism or from one or more cultured organisms. In some embodiments, such microorganisms can be extreme microorganisms such as hyperthermophiles, psychrophilic bacteria, psychrophilic bacteria, halophiles, barophiles, and acidophiles. Polynucleotides encoding enzymes isolated from microorganisms that prefer extreme environments are particularly preferred. Such enzymes can be found in onshore hot springs and deep sea hot water outlets at temperatures above 100 ° C., in Arctic water at temperatures below 0 ° C., in deep sea saturated salt environments, in coal sediments and in sulfur-rich geothermal springs at about 0 ° C. It can work at pH values or at pH values of 11 or higher in sewage sludge. For example, some esterases and lipases cloned and expressed from organisms that prefer extreme environments show high activity over a wide range of temperatures and pHs.
[0151]
The polynucleotide selected and isolated as described above is introduced into a suitable host cell. A suitable host cell is any cell that can promote recombination and / or diminished recombination. Preferably, the selected polynucleotide is already in a vector containing the appropriate control sequences. The host cell may be a higher eukaryotic cell such as a mammalian cell, a lower eukaryotic cell such as a yeast cell, or preferably the host cell may be a prokaryotic cell such as a bacterial cell. Introduction of the construct into host cells is accomplished by calcium phosphate transfection, DEAE-dextran mediated transfection or electroporation (Davis et al., 1986).
[0152]
Typical examples of suitable hosts include bacterial cells such as E. coli, actinomycetes, Salmonella typhimurium, fungal cells such as yeast, insect cells such as Drosophila melanogaster S2 and Spodoptera Sf9, CHO, COS or Bowes melanoma. Animal cells, adenoviruses and plant cells. The selection of a suitable host is considered to be within the skill of the art based on the teachings herein.
[0153]
In particular, with respect to various mammalian cell culture systems used to express recombinant proteins, examples of mammalian expression systems include "SV-40-transformed simian cells support the replication of early SV40 mutants" (Gluzman, 1992). The COS-7 line of monkey kidney fibroblasts and other cell lines capable of expressing compatible vectors, such as C127, 3T3, CHO, HeLa and BHK cell lines. Mammalian expression vectors comprise an origin of replication, a suitable promoter and enhancer, and also any necessary ribosome binding sites, polyadenylation sites, splicing donor and acceptor sites, transcription termination sequences and 5 'flanking non-transcribed sequences. The desired non-transcribed genetic element can be obtained using DNA sequences derived from the SV40 splicing site and the polyadenylation site.
[0154]
Host cells containing the polynucleotide of interest can be cultured in conventional nutrient media modified as appropriate for activation of the promoter, for selection of transformants, or for gene amplification. Culture conditions, such as temperature, pH, etc., are those previously used with the host cell selected for expression, and will be apparent to those skilled in the art. Clones identified as having a particular enzymatic activity are then sequenced to identify polynucleotide sequences encoding enzymes having enhanced activity.
[0155]
In another aspect, it is contemplated that the methods of the present invention can be used to generate novel polynucleotides encoding biochemical pathways derived from one or more operons or gene clusters or portions thereof. For example, bacteria and many eukaryotes have a coordinating mechanism for controlling genes, the products of which are involved in related processes. Genes are clustered in structures called "gene clusters" on a single chromosome and are transcribed together under the control of a single regulatory sequence, including a single promoter that initiates transcription of the entire cluster. Thus, a gene cluster is a group of adjacent genes that are usually identical or related by function. An example of a biochemical pathway encoded by a gene cluster is polyketide. Polyketides are molecules that are very abundant sources of bioactive substances including antibiotics (such as tetracycline and erythromycin), anticancer drugs (daunomycin), immunosuppressants (FK506 and rapamycin) and veterinary preparations (monensin). Many polyketides (produced by polyketide synthases) are of value as therapeutics. Polyketide synthases are multifunctional enzymes and catalyze the biosynthesis of a great many types of carbon chains that vary in length and functional and cyclization patterns. The polyketide synthase genes are within a gene cluster, and at least one species of polyketide synthase (designated Type I) has large size genes and enzymes, which are genetically engineered and these genes / in vitro. Complicating protein research.
[0156]
It is attractive to be able to select and combine desired components from a library of polyketides or fragments thereof and post-polyketide biosynthetic genes to create new polyketides for research. The method of the present invention makes it possible to promote the production of a novel polyketide synthase via intermolecular recombination.
[0157]
Preferably, the gene cluster DNA is isolated from a different organism and ligated into a vector, particularly a vector containing expression control sequences capable of controlling and regulating the production of a protein or protein-related array activity detectable from the linked gene cluster. For use with such gene clusters, it is particularly suitable to use vectors which have a very high capacity for foreign DNA transfer, including, for example, the f-factor of E. coli (ie the fertility factor). It describes in. This f-factor of Escherichia coli is a plasmid that affects its own high frequency of transfection at the time of conjugation, and is ideal for obtaining large DNA fragments such as gene clusters derived from mixed microbial samples and stably growing them. belongs to. Once ligated into a suitable vector, two or more vectors containing different polyketide synthase gene clusters can be introduced into a suitable host cell. Partial homologous sequence regions shared by gene clusters facilitate processes that result in sequence rearrangements resulting in hybrid gene clusters. In addition, novel hybrid gene clusters can be screened for enhanced activity not found in the original gene cluster.
[0158]
Thus, in a preferred embodiment, the present invention is a method of making a biologically active hybrid polypeptide and screening such a polypeptide for increased activity, comprising:
1) at least an operably linked first polynucleotide and an operably linked second polynucleotide (such first and second polynucleotides having at least one partial homology); (Which shares a sequence region) into a suitable host cell,
2) growing the host cell under conditions that promote sequence rearrangement resulting in a hybrid polynucleotide operably linked,
3) expressing a hybrid polypeptide encoded by the hybrid polynucleotide;
4) screening the hybrid polypeptide under conditions that facilitate the identification of enhanced biological activity, and
5) a method by isolating a polynucleotide encoding the hybrid polypeptide.
[0159]
Methods for screening for various enzyme activities are known to those of skill in the art and are discussed herein. Such methods can be used to isolate the polypeptides and polynucleotides of the present invention.
[0160]
Typical examples of expression vectors that can be used include viral particles, baculovirus, phage, plasmid, phagemid, cosmid, phosmid, bacterial artificial chromosomes, viral DNA (eg, vaccinia, adenovirus, fowlpox virus, pseudorabies virus and SV40). Derivatives), P1-based artificial chromosomes, yeast plasmids, yeast artificial chromosomes, and other vectors specific to the particular host of interest (such as bacilli, Aspergillus and yeast). Thus, for example, DNA can be included in any of a variety of expression vectors for polypeptide expression. Such vectors include chromosomal, non-chromosomal and synthetic DNA sequences. Many suitable vectors are known to those of skill in the art, and are commercially available. The following vectors are given by way of example: bacterial; pQE vector (Qiagen), pBluescript plasmid, pNH vector, λ-ZAP vector (Stratagene), ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia), eukaryotic PXT1, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). However, other plasmids or any of the other vectors can be used as long as they are replicable and viable in the host. Low copy number or high copy number vectors can be used in the context of the present invention.
[0161]
A preferred type of vector for use in the present invention contains an f-factor origin of replication. The E. coli f-factor (ie, fertility factor) is a plasmid that affects its own high frequency of transfer during conjugation, and the bacterial chromosome itself transfers only infrequently. In a particularly preferred embodiment, a cloning vector called "phosmid" or a bacterial artificial chromosome (BAC) vector is used. These are derived from E. coli f-factor and can stably incorporate large segments of genomic DNA. When incorporated with DNA from environmental samples that have not been mixed and cultured, this allows large genomic fragments to be in the form of a stable "environmental DNA library."
[0162]
Another preferred type of vector for use in the present invention is a cosmid vector. Cosmid vectors were originally designed to clone and propagate large segments of genomic DNA. Cloning into cosmid vectors is described in detail in "Molecular Cloning: A Laboratory Manual" (Sambrook et al., 1989).
[0163]
The DNA sequence in the expression vector is operably linked to an appropriate expression control sequence (promoter) that directs RNA synthesis. Particularly famous bacterial promoters include lacI, lacZ, T3, T7, gpt, λPR, PLAnd trp. Eukaryotic promoters include CMV immediate early, HSV thymidine kinase, early and late SV40, LTRs from retrovirus and mouse metallothionein-I. Selection of the appropriate vector and promoter is well within the level of ordinary skill in the art. The expression vector also contains a ribosome binding site for translation initiation and a transcription terminator. The vector may also include appropriate sequences for amplifying expression. The promoter region can be selected from any of the desired genes using a CAT (chloramphenicol transferase) vector or another vector having a selectable marker.
[0164]
Further, the expression vector preferably has phenotypic characteristics for selecting transformed host cells, such as dihydrofolate reductase or neomycin resistance for eukaryotic cell culture, or tetracycline or ampicillin resistance in E. coli. Includes one or more selectable marker genes provided.
[0165]
In general, recombinant expression vectors contain an origin of replication and a selectable marker that allow transformation of the host cell, such as the ampicillin resistance gene of E. coli and the S. aureus. Includes promoters from the S. cerevisiae TRP1 gene as well as high expression genes that direct transcription of downstream structural sequences. Such promoters can be derived, inter alia, from operons encoding glycolytic enzymes such as 3-phosphoglycerate kinase (PGK), α-factor, acid phosphatase or heat shock proteins. The heterologous structural sequence is combined in appropriate phase with translation initiation and termination sequences, and preferably a leader sequence capable of directing secretion of the translated protein into the periplasmic space or extracellular medium.
[0166]
Some cloning strategies can allow expression via both the introduced vector and the endogenous promoter, and promotion by the vector can be important for the expression of genes whose endogenous promoter does not function in E. coli.
[0167]
Preferably, DNA isolated or derived from a microorganism is inserted into a vector or plasmid prior to probing the selected DNA. Such a vector or plasmid preferably contains an expression control sequence including a promoter and an enhancer. Such a polynucleotide may be part of a vector and / or construct, or may be as isolated. Because such a vector or construct is not part of its natural environment. Particularly preferred phage or plasmids, and methods for introducing and packaging them, are described in detail in the protocols provided herein.
[0168]
The choice of the cloning vector will depend on the approach taken, for example, with respect to copies of multiple repetitive sequences or multiple sequences that can be successfully transformed into the host cell and selected, the vector should have any competent cloning vector. May be. One example of such a vector is described in "Polycos vectors: a system for packaging filamentous phage and phagemid vectors using lambda phage packaging, extra-stretching and 93-stretching contracts. Growth / maintenance is achieved by cloning vectors with antibiotic resistance. After a growth period, naturally truncated molecules are recovered and identified by size fractionation on a gel or column, or amplified directly. The cloning vector employed may contain a selectable gene that has been interrupted by the insertion of a long construct. As reductive recombination progresses, the number of repeat units decreases, the interrupted gene is re-expressed, and a selection can be made for the processed construct. Vectors that allow for the selection of expression products having the desired biological properties may be expression / selection vectors. The insert may be located downstream of a functional promoter and will be screened for the desired property by any suitable means.
[0169]
In vivo rearrangements are concentrated in an "intermolecular" process collectively called "recombination", which is commonly observed in bacteria as a "RecA-dependent" phenomenon. The invention relies on the ability of the cell to reduce the complexity of the pseudo-repeat sequence in the cell by deletion through the recombination process that recombines and recombines host cell sequences, or a reduction process. This process of "decreasing recombination" occurs by an "intermolecular" RecA-dependent process.
[0170]
Thus, in another aspect of the invention, novel polynucleotides can be made by the process of decreasing recombination. This method involves making constructs containing the contiguous sequence (the original coding sequence), inserting them into a suitable vector, and then introducing them into a suitable host cell. The reassortment of identity of individual molecules occurs through the process of combining between consecutive sequences or between pseudo-repeat units in constructs having regions of homology. The rearrangement process reduces recombination and / or complexity and the extent of repetitive sequences, resulting in the production of new species. Various processes can be applied to increase the reorganization rate. These may include treatment with ultraviolet light or chemicals that damage DNA and / or the use of host cell lines that exhibit enhanced levels of “genetic instability”. Thus, the recombination process can include the natural property of homologous recombination, or pseudorepetitive sequences, that directs their own evolution.
[0171]
Repeat or "pseudo-repeat" sequences play a role in gene instability. In the present invention, "quasi-repeats" are repeats that do not restrict their original unit structure. A pseudo-repeat unit is provided as an array of sequences in the construct, ie, a continuous unit of similar sequences. Once linked, the junctions between the contiguous sequences are essentially invisible, and at the molecular level the resulting pseudo-repeat properties of the construct are no longer contiguous. The deletion process performed by the cell to reduce the complexity of the resulting construct acts between the pseudo-repeats. The pseudo-repeat unit provides a virtually unlimited template repertoire, where the event of misalignment can occur. Thus, constructs containing pseudo-repeats effectively exhibit sufficient molecular flexibility that deletion (and possibly insertion) events can occur virtually anywhere within the pseudo-repeat unit.
[0172]
If the pseudo-repeats are all ligated in the same orientation, eg, head-to-tail, or vice versa, the cells cannot distinguish between the individual units. Thus, a reduction process can occur in the array. In contrast, if, for example, the units show head-to-head rather than head-to-tail, the reversal will delineate the end points of adjacent units, so that deletion formation will tend to eliminate discontinuous units. Therefore, it is preferred for the method that the sequences are in the same direction. Pseudo-repeated sequences in any direction result in a loss of recombination efficiency, while unidirectional sequences provide high efficiency. However, although having only a small number of contiguous sequences in the same direction reduces efficiency, it can still exhibit sufficient flexibility for efficient recovery of new molecules. Constructs can be made up of highly repetitive sequences in the same direction, with some repetition.
[0173]
The arrays can be assembled in a head-to-tail direction using any of a variety of methods, including:
a) Primers are available that include a polyA head and a polyT tail, the orientation of which is single-stranded at the time of construction. This is achieved by having the first few bases of the primer made from RNA, so that RNaseH is easily removed.
[0174]
b) Primers containing unique restriction cleavage sites are available. Multiple sites, a series of unique sequences, and iterative synthesis and ligation steps are required.
[0175]
c) Several bases inside the primer could be thiolated and a molecule with an appropriate tail could be made using exonuclease.
[0176]
Recovery of the recombined sequences is by identifying the cloning vector by reduced RI. The recombined coding sequence can then be amplified and recovered. The product is cloned again and expressed. Recovery of the cloning vector using the reduced RI is performed as follows.
[0177]
1) Use of a vector that is only stably maintained as the construct reduces complexity.
[0178]
2) Physical recovery of the vector shortened by physical means. In this case, the cloning vector is recovered using standard plasmid isolation techniques and size fractionated either on an agarose gel or a column that eliminates low molecular weight using standard techniques.
[0179]
3) Recovery of the vector containing the disrupted gene, which is selectable when the insert size is reduced.
[0180]
4) Use of direct selection techniques with expression vectors and appropriate selection.
[0181]
Coding sequences (eg, genes) from closely related organisms exhibit a high degree of homology and encode entirely different protein products. These types of sequences are particularly useful in the present invention as quasi-repeat types. However, although the examples shown below show recombination of nearly identical prototypical coding sequences (pseudo-repeats), the process is not limited to such nearly identical repeats.
[0182]
The following examples illustrate the method of the present invention. Shown are sequences encoding nucleic acids from three unique species (some repeats). Each sequence encodes a set of proteins with different properties. Each of these sequences differs by one or several base pairs at a unique position in the sequence designated as "A", "B" and "C". The quasi-repeated sequences can be amplified individually or collectively and ligated into a random assembly such that all possible permutations and combinations in the ligated molecular population are obtained. The number of pseudo-repeat units can be controlled by construction conditions. The average number of pseudo-repeat units in a construct is defined as the repeat index (RI).
[0183]
Once formed, the constructs may or may not be size-fractionated on an agarose gel according to published protocols, inserted into cloning vectors and transfected into appropriate host cells. The cells are then expanded to perform a "reducing recombination." The rate of the reducing reassortment process can be stimulated by introducing DNA damage if desired. It does not matter whether the reduction in RI is due to the formation of deletions between the repetitive sequences by an "intramolecular" mechanism or to a recombination-like result through an "intermolecular" mechanism. The end result is to rearrange the molecules into all possible combinations.
[0184]
Optionally, the method binds or interacts with a given macromolecule such as, for example, a proteinaceous receptor, a peptide oligosaccharide, a virion, or other given compound or structure (eg, a catalytic antibody). Etc.) screening additional library members of the shuffled pool to identify individual shuffled library members capable of.
[0185]
Displayed polypeptides, antibodies, mimetic peptide antibodies, and variable region sequences identified from such libraries are used for therapeutic, diagnostic, research, and related purposes (eg, catalysts, solutes to increase aqueous solution permeability, etc.). And / or can be subjected to one or more additional cycles of shuffling and / or affinity selection. The method includes the step of selecting a phenotypic (eg, catalytic activity, stability, oxidation resistance, drug resistance, or detectable phenotype conferred on the host cell) characteristic wherein the step of selecting a phenotype other than the binding affinity for the given molecule. It can be modified to be possible.
[0186]
The present invention provides a method for preparing a library of displayed antibodies suitable for affinity interaction screening. This method comprises the steps of (1) first obtaining a plurality of selected library members comprising an displayed antibody and a related polynucleotide encoding the displayed antibody, and further obtaining the related polynucleotide encoding the displayed antibody. Obtaining said related polynucleotide or a copy thereof, wherein said related polynucleotide comprises substantially the same region of the variable region framework sequence, and (2) suitably comprising said polynucleotide. And growing the cells under conditions that promote recombination and reductive recombination to obtain shuffled polynucleotides. The combination of CDRs included in this shuffled pool is not present in the first multiple selected library members, and the shuffled pool constitutes an exhibit antibody library comprising CDR substitutions, Suitable for action screening. Optionally, the shuffled pool is subjected to an affinity screen to select library members that bind to a given epitope (antigen), thereby selecting a plurality of selected shuffled library members. In addition, multiple selectively shuffled library members can be shuffled and screened for 1-1000 cycles, or as often as desired, until a library member with the desired binding affinity is obtained.
[0187]
In another aspect of the invention, the polynucleotide produced by the method of the invention may be subjected to an agent or process that promotes the introduction of a mutation into the original polynucleotide, before or during recombination or rearrangement. It is considered. The introduction of such mutations will increase the diversity of the resulting hybrid polynucleotide and the polypeptide encoded therefrom. Agents or processes that promote mutagenesis include, but are not limited to, (+)-CC-1065, or (+)-CC-1065- (N3-adenine) (see Sun and Hurley, 1992). ), N-acetylated or deacetylated 4'-fluoro-4-aminobiphenyl adducts that can inhibit DNA synthesis (see, for example, van de Poll et al., 1992), or DNA synthesis. Acetylated or deacetylated 4-aminobiphenyl adduct (also see van de Pol et al., 1992, 751-758), trivalent chromium, trivalent chromium salt, 7-bromomethyl -Benz [a] anthracene ("BMA"), tris (2,3-dibromopropyl) phosphate ( Tris-BP "), 1,2-dibromo-3-chloropropane (" DBCP "), 2-bromoacrolein (2BA), benzo [a] pyrene-7,8-dihydrodiol-9-lO-epoxide (" BPDE "). )), Platinum (II) halogen salts, N-hydroxy-2-amino-3-methylimidazo [4,5-f] -quinoline ("N-hydroxy-IQ"), and N-hydroxy-2-amino- Addition of polycyclic aromatic hydrocarbon ("PAH") DNA capable of inhibiting DNA replication, such as 1-methyl-6-phenylimidazo [4,5-f] -pyridine ("N-hydroxy-PhIP") Things. Particularly desirable is a means for reducing or stopping PCR amplification consisting of ultraviolet (+)-CC-1065 and (+)-CC-1065- (N3-adenine). Particularly included means are polynucleotides comprising a DNA adduct, or a DNA adduct obtained from a polynucleotide or polynucleotide pool, which heats the solution comprising the polynucleotide prior to further processing. It can be released or removed by a process that includes:
[0188]
In another aspect, treating a sample comprising a double-stranded template polynucleotide encoding a wild-type protein under conditions according to the invention that provides for the production of a hybrid or recombined polynucleotide. Are directed to a method for producing a recombinant protein having biological activity.
[0189]
The invention also provides for shuffling populations of viral genes (eg, capsid proteins, spike glycoproteins, polymerases, and proteases) or viral genomes (eg, paramyxoviruses, orthomyxoviruses, herpesviruses, retroviruses, reoviruses, and rhinoviruses). Providing the use of a polynucleotide shuffle to In one embodiment, the present invention provides a method for shuffling sequences encoding all or a portion of an immunogenic viral protein to create new combinations of epitopes as well as novel epitopes produced recombinantly. As provided, such shuffled viral proteins comprise epitopes or combinations of epitopes, as well as novel epitopes produced by recombination, and such shuffled viral proteins may have a natural environment as a result of viral evolution. Or a combination of epitopes (eg, recombination of an influenza virus strain).
[0190]
The present invention also provides methods suitable for shuffling polynucleotide sequences to make gene therapy vectors and replication defective gene therapy constructs. Such methods can be used for human gene therapy, including but not limited to vaccine vectors for DNA-based vaccine transfer, and anti-tumor gene therapy and other common treatment modalities.
[0191]
As used herein, polypeptide annotations are amino-terminal to the left and carboxy-terminal to the right according to standard usage and convention. Similarly, unless otherwise specified, the left end of the single-stranded polynucleotide sequence is the 5 'end, and the left-hand direction of the double-stranded polynucleotide sequence is the 5' direction. The direction of 5 ′ → 3 ′ addition of an unfinished RNA transcript is called the transcription direction, and the sequence region on the DNA strand having the same sequence as the RNA that is the 5 ′ → 5 ′ end of the RNA transcript is referred to as “upstream”. A sequence region on the DNA strand having the same sequence as the RNA and being a 3 ′ → 3 ′ end of the transcript of the coding strand RNA is called a “downstream sequence”.
[0192]
methodology
Nucleic acid shuffling is an in vitro or in vivo method of homologous recombination of a pool of short or small polynucleotides to produce one or more polynucleotides. A mixture of closely related nucleic acid sequences or polynucleotides is subjected to sexual PCR to generate and reassemble random nucleotides to obtain a library or mixed population of recombinant hybrid nucleic acid molecules or polynucleotides.
[0193]
In contrast to cassette mutagenesis, only shuffling and error-prone PCR can mutate a pool of sequences in a blind fashion (without sequence information other than primers).
[0194]
The advantage of the mutagenesis shuffling of the present invention over error-prone PCR alone for the purpose of iterative selection can be very clearly explained by an example from antibody engineering. Consider DNA shuffling as compared to error prone PCR (not sexual PCR). The initial library of selected pool sequences may consist of closely related sequences of various origins (ie, antibodies derived from naive mRNA) or all types of mutagenesis (including shuffling) of a single antibody gene Can be obtained by After the first round of affinity selection, a collection of selected complementarity determining regions (CDRs) is obtained. In the figure, the rich CDR confers on the antibody molecule a high affinity for the antigen. Shuffling allows, for example, a free combinatorial association of all of CDR1 and all of CDR2 with all of CDR3.
[0195]
This method differs from PCR, which is error prone in that it is a reverse chain reaction. In error-prone PCR, the number of polymerase start sites and the number of molecules increase exponentially. However, the sequence of the polymerase start site and the sequence of the molecule remain substantially the same. In contrast, in nucleic acid reassembly or shuffling of random polynucleotides, the number of start sites and the number, but not the size, of random polynucleotides decrease over time. For polynucleotides from all plasmids, the theoretical endpoint is a single, large concatemer molecule.
[0196]
Since crossovers occur in regions of homology, recombination primarily occurs between members of the same sequence family. This eliminates highly mismatched CDR combinations (eg, directed against different epitopes of the same antigen). It is also possible to shuffle multiple sequence families in the same reaction. In addition, shuffling generally preserves the relative order, for example, such that CDR1 is not present at the location of CDR2.
[0197]
Rare chafrants may contain a number of the best (eg, highest affinity) CDRs. These rare chafrants can be selected based on their high affinity.
[0198]
CDRs from a pool of 100 different selected antibody sequences can permutate up to 1,006 permutations. This multiple permutation cannot be represented in a single library of DNA sequences. Therefore, multiple cycles of DNA shuffling and selection may be necessary depending on the desired sequence length and sequence diversity.
[0199]
In contrast, error-prone PCR retains all of the selected CDRs in the same relative sequence and produces a much smaller mutant cloud.
[0200]
The template polynucleotide that can be used in the method of the present invention may be DNA or RNA. It will vary in length depending on the size of the gene to be recombined or reassembled, or the size of a shorter or smaller polynucleotide. Preferably, the template polynucleotide is between 50 bp and 50 kb. All vectors containing a nucleic acid encoding a protein of interest can be used in the method of the present invention, and are, in fact, preferably used.
[0201]
The template polynucleotide can be obtained by amplification using a PCR reaction (US Pat. Nos. 4,683,202 and 4,683,195), or by other amplification or cloning methods. However, removing the free primers from the PCR products before subjecting them to pooling and sexual PCR yields more efficient results. Failure to properly remove primers from the original pool prior to sexual PCR may result in a reduced frequency of crossed clones.
[0202]
The template polynucleotide often should be double-stranded. Double-stranded nucleic acid molecules are recommended to ensure that the resulting single-stranded polynucleotides are complementary to each other and thus hybridize to form double-stranded molecules.
[0203]
Single or double stranded nucleic acid polynucleotides having regions of identity to the template polynucleotide and regions of heterogeneity to the template polynucleotide can be added to the template polynucleotide at this step. It is also conceivable to mix two different but closely related polynucleotide templates at this step.
[0204]
Performing sexual PCR, including slowing down or stopping, on the double-stranded polynucleotide template, and any added double- or single-stranded polynucleotides, yields a mixture of about 5 bp to 5 kb or more. Preferably, the size of the random polynucleotide is from about 10 bp to 1,000 bp, more preferably, the size of the polynucleotide is from about 20 bp to 500 bp.
[0205]
Alternatively, a double-stranded nucleic acid having a plurality of nicks may be used in the method of the present invention. A nick is a break in the single-stranded portion of a double-stranded nucleic acid. The distance between the nicks is preferably 5 bp to 5 kb, more preferably 10 bp to 1,000 bp. This results in a self-primed region, which can produce shorter or smaller polynucleotides to be included, for example, with polynucleotides derived from random primers.
[0206]
The concentration of any specific polynucleotide is 1% by weight or less based on the total amount of polynucleotides, and more preferably the concentration of any specific nucleic acid sequence is 0.1% by weight or less based on the total amount of nucleic acids.
[0207]
The number of various specific polynucleotides in the mixture is at least about 100, preferably at least about 500, and more preferably about 1,000.
[0208]
In this step, single-stranded or double-stranded polynucleotides, whether synthetic or natural, can be added to random double-stranded short or small polynucleotides to increase the heterogeneity of the polynucleotide mixture.
[0209]
Also, in this step, the population of double-stranded, randomly truncated polynucleotides is mixed or combined with the polynucleotide obtained from the sexual PCR step, optionally in one or more additional sexual PCR cycles. May be attached.
[0210]
If it is desired to insert a mutation into the template polynucleotide, a single- or double-stranded polynucleotide having a region of identity to the template polynucleotide, as well as a region of heterogeneity to the template polynucleotide, is added to the total nucleic acid. Add in a 20-fold excess. More preferably, the single-stranded polynucleotide is added in a 10-fold excess over the total nucleic acid.
[0211]
If a mixture of different but closely related template polynucleotides is desired, the populations of polynucleotides from each template are combined in a ratio of less than about 1: 100. This ratio is more preferably less than about 1:40. When it is desirable to backcross a wild-type polynucleotide, for example, using a mutated polynucleotide population to remove neutral mutations (eg, mutations that result in unwanted changes in the characteristics of the selected phenotype). There is also. In such an example, the ratio of randomly provided wild-type polynucleotide that can be added to the randomly provided sexual PCR cycle hybrid polynucleotide is from about 1: 1 to about 100: 1, more preferably, 1: 1. : 1 to 40: 1.
[0212]
The mixed population of random polynucleotides is denatured to form single-stranded polynucleotides and then re-annealed. Only single-stranded polynucleotides that have regions of homology to other single-stranded polynucleotides will reanneal.
[0213]
Random polynucleotides can be denatured by heating. One of skill in the art will be able to determine the conditions necessary to completely denature a double-stranded nucleic acid. Preferably, the temperature is between 80 and 100C, more preferably between 90 and 96C. Other means used to denature the polynucleotide include pressure (36) and pH.
[0214]
The polynucleotide may be re-annealed by cooling. Preferably, the temperature is between 20C and 75C, more preferably between 40C and 65C. If high frequency crossovers are required, based on an average of only four contiguous bases of homology, recombination can be forced using lower annealing temperatures, but this method is difficult. Become. The degree of subsequent reconstitution will depend on the degree of homology between the population of single-stranded polynucleotides.
[0215]
Reconstitution can be accelerated by the addition of polyethylene glycol (PEG) or a salt. The salt concentration is preferably 0 mM to 200 mM, and more preferably the salt concentration is 10 mM to 100 mm. The salt may be KCl or NaCl. The concentration of PEG is preferably 0% to 20%, more preferably 5% to 10%.
[0216]
Next, the annealed polynucleotide is incubated in the presence of a nucleic acid polymerase and dNTPs (ie, dATP, dCTP, dGTP and dTTP). The nucleic acid polymerase can be a Klenow fragment, Taq polymerase, or other DNA polymerases known to those skilled in the art.
[0217]
The technique used for assembly depends on the minimum homology that will still result in the intersection. If the region of identity is large, use Taq polymerase and set the annealing temperature at 45-65 ° C. If the identity region is narrow, the annealing temperature is adjusted to 20 to 30 ° C. using Klenow polymerase. One skilled in the art will be able to adjust the annealing temperature to increase the number of intersections achieved.
[0218]
The polymerase can be added before, simultaneously with, or after annealing.
[0219]
The cycle of denaturation, reconstitution, and incubation in the presence of polymerase is referred to herein as nucleic acid shuffling or reassembly. This cycle is repeated a desired number of times. Preferably, this cycle is repeated 2 to 50 times, more preferably 10 to 40 times.
[0220]
The resulting nucleic acid is a large double-stranded polynucleotide of about 50 bp to about 100 kb, preferably, the large polymerase is 500 bp to 50 kb.
[0221]
The large polynucleotide may contain a tandem copy of the polynucleotide of the same size as the template polynucleotide. Next, the concatenated polynucleotide is denatured to a single copy of the template polynucleotide. As a result, a population of polynucleotides approximately the same in size as the template polynucleotide is obtained. This population is a mixed population in which single or double-stranded polynucleotides having regions of identity and regions of heterogeneity have been added to the template polynucleotide before shuffling.
[0222]
These polynucleotides are then cloned into a suitable vector and the ligation mixture is used to transform bacteria.
[0223]
A single polynucleotide is amplified prior to cloning by various methods, including PCR (US Pat. Nos. 4,683,195 and 4,683,202), rather than digestion of concatemers. It is believed that a single polynucleotide can be produced from a large concatenated polynucleotide.
[0224]
The vector used for cloning is not particularly limited as long as it can receive a polynucleotide of a desired size. If expression of a particular polynucleotide is desired, the cloning vehicle will include transcription and translation signals adjacent to the site of insertion of the polynucleotide to allow expression of the polynucleotide in a host cell. Must be there. Preferred vectors include the pUC and pBR series of plasmids.
[0225]
The bacterial population obtained in this way contains a large number of recombinant polynucleotides with random mutations. This mixed population can be tested to identify the desired recombinant polynucleotide. The method of selection depends on the desired polynucleotide.
[0226]
For example, if one desires a polynucleotide that encodes a protein that has a high binding efficiency for the ligand, one skilled in the art will appreciate the ability of the protein expressed by each portion of the polynucleotide in the population or library to bind the ligand. It is tested by various known methods (ie, panning, affinity chromatography). If a polynucleotide encoding a protein with high drug resistance is desired, the protein expressed by each of the polynucleotides in the population or library is tested for its ability to confer drug resistance on the host organism. Given the information of the desired protein, one of skill in the art will readily be able to identify polynucleotides that confer the desired properties on the protein by testing the population.
[0227]
One skilled in the art can use a phage display system (Pharmacia, Milwaukee, Wis.) That expresses protein fragments as fusion proteins on the phage surface. The recombinant DNA molecule is cloned into phage DNA at the site where transcription of the fusion protein, part of which is encoded by the recombinant DNA molecule, occurs. Phage containing the recombinant nucleic acid molecule undergo replication and transcription within the cell. The leader sequence of the fusion protein directs the transport of the fusion protein to the tip of the phage particle. In this way, the fusion protein partially encoded by the recombinant DNA molecule is displayed on phage particles and detected and selected by the methods described above.
[0228]
In addition, multiple nucleic acid shuffling cycles may be performed on polynucleotides from a sub-population of the first population that include DNA encoding the desired recombinant protein. In this way, it may be possible to achieve proteins with higher binding affinity or enzymatic activity.
[0229]
Also, by performing multiple nucleic acid shuffling cycles on a mixture of a wild-type polynucleotide and a nucleic acid sub-population obtained from the first or subsequent rounds of nucleic acid shuffling, the sub-population can be silently mutated. Can also be removed.
[0230]
Any source of purified nucleic acid can be used as the starting nucleic acid. Therefore, in this method, DNA or RNA including messenger RNA can be used, and the DNA or RNA may be single-stranded or double-stranded. Furthermore, a DNA-RNA hybrid containing each single strand may be used. Nucleic acid sequences vary in length depending on the size of the nucleic acid sequence to be mutated. Preferably, the particular nucleic acid sequence is between 50 and 50,000 base pairs. It is also conceivable for the method of the present invention to use a vector containing a nucleic acid encoding a protein of interest.
[0231]
Nucleic acids can be obtained from any source, for example, plasmids such as pBR322, cloned DNA or RNA, or natural DNA or RNA from any source, including bacteria, yeast, viruses, and higher organisms such as plants and animals. It may be obtained from. DNA or RNA may be obtained from blood or tissue material. The template polynucleotide can be obtained by amplification using a polynucleotide chain reaction (PCR, US Pat. Nos. 4,683,202 and 4,683,195). Alternatively, the polynucleotide may be contained in a vector present in the cell, and sufficient nucleic acid can be obtained by culturing the cell and collecting the nucleic acid from the cell by a method known to those skilled in the art.
[0232]
Any particular nucleic acid sequence can be used to generate a hybrid population according to the methods of the present invention. The only requirement is that a small population of hybrid sequences of a particular nucleic acid sequence be present or created prior to the method.
[0233]
The initial subpopulation of a particular nucleic acid sequence having a mutation can be created by a number of different methods. Mutations may be generated by error prone PCR. Error-prone PCR uses low-fidelity polymerization conditions to randomly introduce low levels of point mutations over long sequences. Alternatively, mutations can be introduced into the template polynucleotide by oligonucleotide-directed mutagenesis. In oligonucleotide-directed mutagenesis, short sequence polynucleotides are removed from the polynucleotide using restriction enzyme digestion and replaced with synthetic polynucleotides. In this synthetic polynucleotide, various bases are changed from the original sequence. Also, the polynucleotide sequence can be changed by chemical mutagenesis. Chemical mutagens include, for example, sodium bisulfite, nitrous acid, hydroxylamine, hydrazine or formic acid, and the like. Other agents that are analogs of nucleotide precursors include nitrosoguanidine, 5-bromouracil, 2-aminopurine, or acridine. Generally, these agents are added to the PCR reaction in place of the nucleotide precursor, thereby mutating the sequence. Further, intercalating agents such as proflavine, acriflavine, and quinacrine may be used. Random mutagenesis of a polynucleotide can also be achieved by irradiation with X-rays or ultraviolet light. Generally, the plasmid polynucleotide so mutated is introduced into E. coli and propagated as a pool or library of hybrid plasmids.
[0234]
Alternatively, a small mixed population of specific nucleic acids can be found in nature, where these nucleic acids consist of the same gene or various alleles of the same gene from different closely related species (ie, cognate genes). obtain. Alternatively, these nucleic acids may be related DNA sequences found in one species, for example, immunoglobulin genes.
[0235]
Once a mixed population of specific nucleic acid sequences has been generated, the polynucleotides can be used directly or inserted into an appropriate cloning vector by methods known to those skilled in the art.
[0236]
The choice of vector will depend on the size of the polynucleotide sequence and the host cell used in the method of the invention. The template of the present invention may be a plasmid, a phage, a cosmid, a phagemid, a virus (eg, retrovirus, parainfluenza virus, helper virus, reovirus, paramyxovirus, etc.), or a selected portion thereof (eg, coat protein, spike (Spike) glycoprotein, capsid protein). For example, if the particular nucleic acid sequence to be mutated is large, cosmids and phagemids are preferred. This is because these vectors can stably expand large polynucleotides.
[0237]
When cloning a mixed population of specific nucleic acid sequences into a vector, the vector can be cloned by inserting each vector into a host cell and amplifying the vector into the host cell. This is called clonal amplification because the absolute number of nucleic acid sequences increases while the number of hybrids does not. The usefulness can be easily determined by screening the expressed polynucleotide.
[0238]
The DNA shuffling method of the present invention can be performed in a blind manner on a pool of unknown sequences. By adding oligonucleotides (having ends homologous to the sequence to be reassembled) to the reassortment mixture, any sequence mixture can be incorporated into another sequence mixture at any particular location. Thus, it is believed that a mixture of synthetic oligonucleotides, a mixture of PCR polynucleotides, or even a mixture of all genes can be mixed at defined locations into another sequence library. Insertion (mixing) of one sequence is independent of insertion of the sequence into another part of the template. Thus, the degree of recombination, the required homology, and the diversity of the library can be varied independently and simultaneously along the length of the reassembled DNA.
[0239]
This technique of mixing two genes is useful for humanizing antibodies derived from mouse hybridomas. Techniques for mixing the two genes or inserting alternative sequences into the genes are useful for any protein used in therapy, such as interleukin I, antibodies, tPA and growth hormone. This approach is also useful for enhancing expression or altering the specificity of protein expression in any nucleic acid, for example, promoters or introns, or 31 or 51 untranslated regions of a gene. This technique can also be used to mutate ribozymes or aptamers.
[0240]
Shuffling requires the presence of regions of homology that separate regions of diversity. A scaffold-like protein structure is particularly suitable for shuffling. The conserved scaffold determines the overall folding by self-association, while displaying a relatively unrestricted loop that mediates specific binding. Examples of such scaffolds include immunoglobulin beta barrels, as well as 4-helix bundles, known to those skilled in the art. This shuffling can be used to generate scaffold-like proteins with various combinations of mutant sequences for binding.
[0241]
Saturation mutagenesis
In one aspect, the present invention provides patented codon primers for introducing point mutations in a polynucleotide to create a series of progeny polypeptides in which the entire range of a single amino acid substitution is represented at each amino acid position ( (Including degenerate N, N, G / T sequences). The oligo used includes a first homologous sequence, a degenerate N, N, G / T sequence, and a preferred but not necessarily second homologous sequence. Since the degeneracy of the N, N, G / T sequences includes codons for all 20 amino acids, the downstream progeny translation products resulting from the use of such oligos may have potential at each amino acid site along the polypeptide. Includes all certain amino acid changes.
In one embodiment, such one degenerate oligo (comprising a single degenerate N, N, G / T cassette) causes each native codon in the parent polynucleotide template to undergo a full range of codon substitutions. Used for In another aspect, at least two degenerate N, N, G / T cassettes, whether within the same oligo or not, are subjected to full range codon substitutions in at least two prototype codons of the parent polynucleotide template. Let it. Thus, if two or more N, N, G / T sequences are included in one oligo, amino acid mutations can be introduced at two or more sites. The plurality of N, N, G / T sequences may be immediately adjacent or separated by one or more additional nucleotide sequences. In another aspect, oligos useful for introducing additions and deletions are used alone or in combination with codons comprising N, N, G / T sequences to provide for any of the additions, deletions and / or substitutions of amino acids. Combinations or permutations can be introduced.
[0242]
To illustrate specifically, adjacent N, N, G / T triplets, ie, degenerate (N, N, G / T)nOligos containing a sequence can be used to mutagenize two or more adjacent amino acid positions simultaneously.
[0243]
In another aspect, the invention provides for the use of a degenerate cassette that is less degenerate than the N, N, G / T sequence. For example, in some instances, use a degenerate triplet sequence that includes only one N, where N may be at the first, second, or third position of the triplet (eg, in an oligo). Is desirable. Any other base, including any combination and permutations thereof, can be used leaving two positions in the triplet. Alternatively, in some instances, it may be desirable to use degenerate N, N, N triplet sequences or N, N, G / C triplet sequences (eg, in an oligo).
[0244]
However, the use of degenerate triplets (such as N, N, G / T or N, N, G / C triplet sequences) as disclosed in the present invention may be advantageous for several reasons. In one aspect, the present invention provides a systematic and extremely easy method for substituting the entire range of possible amino acids (all 20 amino acids) for each amino acid in a polypeptide and for each amino acid position. Provides the means to bring. Thus, for a 100 amino acid polypeptide, the present invention provides a means to systematically and very easily create 2,000 different species (ie, 20 possible amino acids per position x 100 amino acid positions). . It is believed that the use of oligos containing degenerate N, N, G / T or N, N, G / C triplet sequences provides 32 independent sequences encoding 20 possible amino acids. Thus, in a reactor in which the parent polynucleotide sequence is subjected to saturation mutagenesis using one such oligo, 32 different progeny polynucleotides encoding 20 different polypeptides are generated. In contrast, the use of non-degenerate oligos in site-directed mutagenesis yields only one progeny polypeptide product per reactor.
[0245]
The invention also provides for the use of non-degenerate oligos that can be used in conjunction with the disclosed degenerate primers. In some situations, it may be advantageous to use non-degenerate oligos to create point mutations specific to the polynucleotide being performed. This provides a means to create specific silent point mutations, point mutations that result in a change in the corresponding amino acid, and point mutations that cause the generation of a stop codon and the expression of the corresponding polypeptide fragment.
[0246]
Thus, in a preferred embodiment of the present invention, each saturation mutagenesis reactor contains a polynucleotide encoding at least 20 progeny polypeptide molecules, so that all 20 amino acids are mutated in the parent polynucleotide. It is represented by one specific amino acid position corresponding to the position of the induced codon. The 32-fold degenerate progeny polypeptide resulting from each saturation mutagenesis reaction can be subjected to clonal amplification (eg, cloning into a suitable E. coli host using an expression vector) and expression screening. it can. If the screen identifies individual progeny polypeptides that exhibit favorable property changes (as compared to the parent polypeptide), sequencing accordingly to identify the preferred amino acid substitutions contained therein. Is possible.
[0247]
Identifying preferred amino acid changes at two or more amino acid positions for mutagenesis at each amino acid position and for each amino acid within the parent polypeptide using the saturation mutagenesis disclosed herein. It is thought that it is possible. One or more new progeny molecules can be created that contain a combination of all or some of these preferred amino acid substitutions. For example, if two specific and preferred amino acid changes are identified at each of the three amino acid positions in a polypeptide, each position (unchanged from the original amino acid and two are each preferred) Variation), three possibilities and three positions are included in the permutation. Thus, including the seven, ie, six, single point mutations examined so far (ie, two at each of the three positions) and those that have not changed at any of the positions, ie, 3 × 3 × 3, ie There are a total of 27 possibilities.
[0248]
In yet another aspect, site saturation mutagenesis can be used in conjunction with screening, in conjunction with shuffling, chimerization, recombination and other mutagenesis processes. The invention provides for the use of any iterative mutagenesis method, including saturation mutagenesis. As one example, repeated use of any mutagenesis method is used in conjunction with screening.
[0249]
Thus, by way of example, and not limitation, the present invention is directed to methods, such as methods for introducing two or more related polynucleotides into a suitable host cell, such that the hybrid polynucleotides result from recombination and diminishing recombination. The use of saturation mutagenesis in combination with the mutagenesis method is provided.
[0250]
In addition to performing mutagenesis along the entire sequence of a gene, the present invention provides mutagenesis that can be used to replace each and every number of bases in a polynucleotide sequence, Here, the number of bases to be mutated is preferably all integers from 15 to 100,000. Thus, instead of mutagenizing every position along the molecule, it is possible to mutate every discrete number of bases (preferably a subset of a total of 15 to 100,000). Preferably, separate nucleotides are used to mutagenize each position or group of positions along the polynucleotide sequence. One group of three positions to be mutagenized may be one codon. Mutations are preferably introduced using mutagenic primers comprising a heterologous cassette, also called a mutagenic cassette. Preferred cassettes can have from 1 to 500 bases. Each nucleotide position in such a heterologous cassette is N, A, C, G, T, A / C, A / G, A / T, C / G, C / T, G / T, C / G / T, A / G / T, A / C / T, A / C / G or E, where E may be any base other than A, C, G or T (E may be referred to as a designer oligo) . The table below shows exemplary trinucleotide cassettes (N, N, G / T; N, N, N and N, N, A / C, plus over 3000 possible).
[0251]
In a general sense, saturation mutagenesis is a complete set of mutagenesis cassettes within a defined polynucleotide sequence to be mutagenized, wherein the sequence to be mutagenized is preferably 15-100,000 bases in length. (Each cassette is preferably 1-500 bases in length). Thus, a group of mutations (ranging from 1 to 100 mutations) is introduced into each cassette and mutagenized. During a single saturation mutagenesis, the group of mutations introduced into one cassette may be different or the same as the group of second mutations introduced into a second cassette. You may. Examples of such groups include deletions, additions, groups of specific codons, and groups of specific nucleotide cassettes.
[0252]
The defined sequences to be mutagenized (see FIG. 20) preferably include whole genes, pathways, cDNAs, entire open reading frames (ORFs) and complete promoters, enhancers, repressors / transactivators, origins of replication, introns , An operator, or any polynucleotide functional group. In general, preferred "defined sequences" for this purpose have a polynucleotide sequence of 15 bases and a polynucleotide sequence of 15 bases to 15,000 bases in length (the present invention specifically names all integers therebetween). It can be any polynucleotide. When selecting a group of codons, the type of amino acid encoded by the degenerate mutagenesis cassette is considered.
[0253]
In a particularly preferred example of the group of mutations that can be introduced into the mutagenesis cassettes (see Tables 1-85), the invention particularly relates to 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 , 12, 13, 14, 15, 16, 17, 18, 19 and 20 amino acids at each position are provided with degenerate codon substitutions (using degenerate oligos) and polypeptide libraries encoded thereby. .
[0254]
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
Figure 2004500019
2.11.2.3. Exonuclease-mediated reassembly
In certain embodiments, the invention provides for shuffling, assembling, reassembling, recombination, and / or conjugating at least two polynucleotides to produce progeny polynucleotides (eg, expressed, polypeptides or genes). A chimeric progeny polynucleotide capable of forming a pathway). In certain embodiments, a double-stranded polynucleotide terminus (eg, two single-stranded sequences hybridized to each other for hybridization) is treated with an exonuclease to release nucleotides from one of the two strands. The remaining strand, free of its original partner, can be left, and if desired, the remaining strand can be used to achieve hybridization with another partner.
[0255]
Specifically, the double-stranded polynucleotide terminus, which may be part of or connected to a polynucleotide or non-polynucleotide sequence, is exposed to a source of exonuclease activity. Useful sources of exonuclease activity include enzymes having 3 'exonuclease activity, enzymes having 5' exonuclease activity, enzymes having both 3 'exonuclease activity and 5' exonuclease activity, and any of these. Or a combination thereof. Exonucleases can be used to release nucleotides from one or both ends of a linear double-stranded polynucleotide, as well as from one end to the entire end of a branched polynucleotide having three or more ends. The mechanism of this releasing action is thought to consist of enzymatically catalyzed hydrolysis of the terminal nucleotide, which can proceed in a time-dependent manner and experimentally control the progress of the enzymatic treatment.
[0256]
In contrast, non-enzymatic methods can be used to shuffle, assemble, reassemble, recombine, and / or consolidate polynucleotide building blocks, which denature working samples ( Or "melting") conditions (e.g., by changing temperature, pH, and / or salinity conditions) and consists of melting a working set of double-stranded polynucleotides into single-stranded polynucleotides. For shuffling, the polynucleotide single strand will, to some extent, participate in annealing with different hybridization partners (ie, prior to the denaturation step, exclusive between the former partners). Simply do not revert to re-annealing). However, the presence of the previous hybridization partner in the reaction vessel does not prevent reannealing of the previous partner to the single stranded polynucleotide to reform the original double stranded polynucleotide, Sometimes it works.
[0257]
In contrast to the non-enzymatic shuffling method described above, which comprises subjecting the double-stranded polynucleotide building block to denaturation and then performing an anneal, the present invention further provides exonucleases that do not require denaturation. Provide an approach based on: Rather, avoiding denaturing conditions, as well as maintaining the double-stranded polynucleotide substrate in an annealed (ie, non-denaturing) state, are conditions necessary for the action of exonucleases (eg, exonuclease III and redα gene products). Further, in contrast, the generation of a single-stranded polynucleotide sequence capable of hybridizing to another single-stranded polynucleotide sequence is a consequence of covalent cleavage (and thus sequence disruption) at one hybridization partner, Occur. For example, the exonuclease III enzyme can be used to enzymatically release the 3 'terminal nucleotide of a single hybridization strand, thereby achieving covalent hydrolysis in the polynucleotide strand. This facilitates hybridization of the remaining single strand with the new partner (since the former partner has been subjected to covalent cleavage).
[0258]
More specifically, examples of the 3 'exonuclease include a specific exonuclease, namely, exonuclease III. However, other exonucleases may be used, such as enzymes having 5 'exonuclease activity and enzymes having 3' exonuclease activity, as well as enzymes that have not been discovered and have not been developed. In particular, for the techniques disclosed above, the discovery and optimization of enzymes with more optimal kinetics and / or higher specific activity and / or less unwanted activity (eg, directed It should be especially noted that both evolution and discovery and optimization are possible. Indeed, it is expected that the present invention will encourage the discovery and / or development of such designer enzymes. That is, the present invention can be carried out using various exonuclease enzymes that are currently available, as well as enzymes that have not been discovered yet or that have not yet been developed.
[0259]
The exonuclease action of exonuclease III requires a working double-stranded polynucleotide terminus that is blunt or has a 5 'overhang, and the exonuclease action allows the enzyme to release the 3' terminal nucleotide. To leave the single-stranded 5 'end. The 5 'end becomes longer as the exonuclease action proceeds (see FIG. 1). Using the 5 'overhangs generated by this technique, another single-stranded polynucleotide sequence that shares sufficient homology to allow hybridization (which may also be a single-stranded polynucleotide, Alternatively, it may be a terminal overhang of a partially double-stranded polynucleotide). Due to the ability of these exonuclease III-generated single-stranded sequences (eg, in the 5 'overhang) to hybridize to other single-stranded sequences, the shuffling, assembly, reassembly, and And / or chaining is possible.
[0260]
In addition, if desired, the termini of the double-stranded polynucleotide can be protected or the termini can be rendered more susceptible to the desired enzymatic action of a useful exonuclease. For example, a double-stranded polynucleotide end having a 3 'overhang is less susceptible to exonuclease action of exonuclease III. However, various means can make it susceptible to the exonuclease action of exonuclease III. For example, the polynucleotide is blunt-ended by treatment with a polymerase; the polynucleotide is cleaved to give a blunt end or 5 'overhang; ligated (ligated or hybridized) to another double-stranded polynucleotide To give blunt ends or 5 'overhangs; hybridize to single-stranded polynucleotides to give blunt ends or 5' overhangs; or are modified by any of a variety of means.
[0261]
According to one aspect, the exonuclease is allowed to act at one or both ends of the linear double-stranded polynucleotide and progress completely, almost completely or partially. When the exonuclease action is fully advanced, the length of each 5 'overhang will increase toward the central region of the polynucleotide in a direction that is considered to be a "rendezvous point" (near the polynucleotide center point). It extends for a long time. Finally, each produces a single-stranded polynucleotide (which can also be dissociated) about half the length of the original double-stranded polynucleotide (FIG. 1). Alternatively, it is possible to terminate the exonuclease-mediated reaction before proceeding completely.
[0262]
Thus, this exonuclease-mediated technique is useful in performing shuffling, assembly, and / or reassembly, recombination, and conjugation of polynucleotide building blocks. In addition, this polynucleotide building block has a base length of up to ten, tens of bases, hundreds of bases, thousands of bases, tens of thousands of bases, and hundreds of thousands of bases. It may be as long or several million bases long, or longer.
[0263]
This exonuclease-mediated approach is based on the action of the double-stranded DNA-specific exodeoxyribonuclease activity of Escherichia coli exonuclease III. Exonuclease III substrates can be produced by fragmenting double-stranded polynucleotides. Fragmentation can be achieved by mechanical means (eg, shearing, sonication, etc.), enzymatic means (eg, using restriction enzymes), and any combination thereof. Larger polynucleotide fragments can also be obtained by polymerase-mediated synthesis.
[0264]
Exonuclease III is a product of the 28K monomer enzyme, the xthA gene of E. coli, and has four known activities: exodeoxyribonuclease (herein referred to as exonuclease, instead), RNaseH, DNA- 3'-phosphatase, as well as AP endonuclease. Exodeoxyribonuclease activity is specific for double-stranded DNA. It is thought that the mechanism of action is to cause enzymatic hydrolysis of DNA gradually from the 3 'end toward the 5' direction to form the remaining single strand with the nucleoside 5'-phosphate. This enzyme does not show efficient hydrolysis of single-stranded DNA, single-stranded RNA, or double-stranded RNA, but degrades RNA in DNA-RNA hybrids to release nucleoside 5'-phosphate . The enzyme also specifically releases inorganic phosphate from the 3 'phosphomonoester group of DNA, but not from RNA or short oligonucleotides. By removing these groups, the ends are converted to primers for DNA polymerase action.
[0265]
Another example of an enzyme having exonuclease activity is red alpha and snake venom phosphodiesterase. The red alpha (redα) gene product (also called lambda exonuclease) is derived from bacteriophage λ. The redα gene is transcribed from the leftward promoter, and its product is involved in recombination (24 kD). The red alpha gene product acts progressively from the 5'-phosphorylated end to release mononucleotides from double-stranded DNA (Takahashi and Kobayashi, 1990). Snake venom phosphodiesterase (Laskowski, 1980) can rapidly open supercoiled DNA.
[0266]
It is contemplated that related but not identical nucleic acid strands can hybridize as one step in the generation of a chimeric molecule. However, since these nucleic acid strands are not identical, it is possible to form what is also called a heteromeric complex, which is an annealing of non-identical nucleic acids. In this complex, the two heterologous chains may partially hybridize, but the terminal sequences of the remarkably heterologous chains do not appear to hybridize, so these heterologous chains may hybridize. Will be. This is a problem, however, because the non-hybridizing ends are not optimal for initiating extension or serving as ligation points. Thus, in another embodiment, the present invention provides a method for releasing 3 ′ and 5 ′ terminal nucleotides from unhybridized single-stranded ends of an annealed nucleic acid strand in a heteronucleic acid complex, wherein But provides the use of exonuclease treatment as a means of promoting polymerase-based extension and / or ligase-mediated ligation of the treated ends by leaving hybridized ends. This procedure has been tentatively referred to as "pruning of loose ends". Various exonucleases can be used for this "pruning" purpose. Particularly preferred exonuclease treatments for "pruning" purposes according to the present invention include treatment with Mung bean nuclease, treatment with S1 nuclease, and E. coli nuclease. Coli DNA and the like. Further preferred exonuclease treatments for “pruning” purposes according to the present invention include the use of the enzymes listed below (which selectively provide the characteristics of the selected enzyme).
[0267]
Exonuclease
Figure 2004500019
a. Stratagene
b. Promega
c. Epicenter
d. Roche
e. Kong, H .; M. Kucera, R .; B. . , And Jack, W.W. E. FIG. , (1993) Biol. Chem.
268, 1965-1975.
f. McClure, W.C. R. and Jobin, T.W. M. , (1975) Biol. Chem 250, 4073-
4080.
g. Polesky A. H. , Steitz, T.W. A. , Grindley, N.M. D. F. and Joyce, C.I. M. , (1990)
J. Biol. Chem. 265, 14579-14591.
h. Gillin, F.C. D. and Nossal, N.W. G. FIG. , (1975) Biochem. Biophys. Res.
Commun. 64, 457-464.
i. Patel, S.M. S. , Wond, E.A. and Johnson, K.C. A. , (1991) Biochemistry 30,
511-525.
k. Some higher double-stranded exonuclease cleavage at both ends with higher concentrations of enzyme
Shows creatase activity
m. Some double-stranded exonucleases that cleave at higher concentrations of enzyme
Show activity
In another preferred aspect, the invention provides that the nucleic acid building block for exonuclease-mediated reassembly comprises nucleic acid strands that form a heterocomplex when hybridized to non-identical nucleic acid strands. In such a complex, the strand that anneals to one or more other strands is called a multi-attached strand, and the strand that anneals to only one other strand is called a single-attached strand. Thus, usually, but not always, the length of a single bond is shorter than a multiple bond. In a non-limiting example, both single and multi-linked strands can be synthesized, fragmented (either physically or enzymatically), isolated (such as by selection with Dpn I) and / or denatured by template. It can be produced from ancestral molecules.
[0268]
2. 11 . 2.3. Non-stochastic connected reassembly
In one aspect, the present invention provides a non-stochastic method called synthetic connected reassembly (SLR). This is somewhat closer to stochastic shuffling except that the nucleic acid building blocks are non-stochastically aggregated rather than randomly shuffled or concatenated or chimerized.
[0269]
A particularly clear difference is that this SLR method does not depend on whether there is a high level of homology between the polynucleotides to be shuffled. In contrast, conventional methods, particularly conventional stochastic shuffling methods, required a high level of homology between the polynucleotides to be shuffled, especially at the junction site. Thus, these conventional methods are advantageous for the regeneration of the original precursor molecule and are a sub-optimal means for producing a large number of new progeny chimeras, especially full-length progeny. In contrast, using the present invention, 10100Libraries (or sets) of more than three different chimeras can be generated non-stochastically. In addition, using SLR, 10100It is envisioned that a library consisting of these different progeny chimeras (unless known, there is no upper limit) could be generated.
[0270]
Thus, in one aspect, the present invention is a non-stochastic method of generating a final set of chimeric nucleic acid molecules having an overall assembling order selected by design, wherein useful and compatible ligation ends are identified. The present invention provides a method comprising the steps of generating a plurality of specific nucleic acid building blocks by designing, and assembling the nucleic acid building blocks so that the designed overall assembly order is achieved.
[0271]
Mutually compatible linkable ends of the nucleic acid building blocks to be assembled are "useful" for this type of ordered assembly, provided that the ends allow the building blocks to be joined in a predetermined order. Consider Thus, in one aspect, the overall configuration order in which the nucleic acid building blocks can be joined is determined by the design of the ligatable ends. When one or more assembly steps are used, the overall assembly order for joining the nucleic acid building blocks is also determined by the sequential order of the assembly steps. FIG. 4, Panel C, illustrates an assembly method consisting of two consecutive steps to achieve a designed (non-stochastic) overall assembly order for the five nucleic acid building blocks. In a preferred embodiment of the invention, the annealed component is treated with a ligase (eg, T4 DNA ligase) to achieve covalent attachment of the component.
[0272]
In a preferred embodiment, the design of a nucleic acid building block is obtained by analyzing the sequence of a set of precursor nucleic acid templates that serves as a basis for generating a progeny set of the final chimeric nucleic acid molecule. These precursor nucleic acid templates serve as sequence sources that aid in the design of nucleic acid building blocks that are to undergo mutagenesis, ie, are to be chimerized or shuffled.
[0273]
In one aspect, the invention relates to the chimerization of closely related gene families and the encoded families of these closely related products. Specifically, the encoded product is an enzyme. According to embodiments of the present invention, the following enzymes and their functions may be mentioned as representative examples of a group of enzymes capable of causing mutagenesis.
[0274]
1 lipase / esterase
a. Enantioselective hydrolysis of esters (lipids) / thioesters
1) Separation of racemic mixture
2) Synthesis of optically active acid or alcohol derived from methodiester
b. Selective synthesis
1) Regiospecific hydrolysis of carbohydrate esters
2) Selective hydrolysis of cyclic secondary alcohol
c. Synthesis of optically active esters, lactones, acids and alcohols
1) Transesterification of activated / inactivated ester
2) Interesterification
3) Hydroxyester-derived optically active lactone
4) The position of the anhydride and the chiral selective ring opening
d. Detergent
e. Fat / oil conversion
f. Aging of cheese
2 Protease
a. Ester / amide synthesis
b. Peptide synthesis
c. Resolution of racemic mixtures of amino acid esters
d. Synthesis of unnatural amino acids
e. Detergent / protein hydrolysis
3 Glycosidase / glycosyltransferase
a. Sugar / polymer synthesis
b. Cleavage of glycosidic bonds to produce mono-, di- and oligosaccharides
c. Synthesis of complex oligosaccharides
d. Glycoside synthesis using UDP-galactosyltransferase
e. Glycosyl transfer of disaccharide, glycosyl fluoride, arylgalactoside
f. Glycosyl transfer in oligosaccharide synthesis.
g. Diastereoselective cleavage of β-glucosyl sulfoxide
h. Asymmetric glycosylation
i. Food processing
j. Paper processing
4 phosphatase / kinase
a. Synthesis / hydrolysis of phosphate ester
1) -position, enantioselective phosphorylation
2) Introduction of phosphate ester
3) Synthesis of phospholipid precursor
4) Controlled polynucleotide synthesis
b. Activation of biological molecules
c. Formation of selective phosphate bond without protecting group
5 mono / dioxygenase
a. Direct oxy-functionalization of unactivated organic substrates
b. Alkane, aromatic and steroid hydroxylation
c. Epoxidation of alkenes
d. Chiral selective sulfoxidation
e. Regio- and stereoselective Bayer-Villiger oxidation
6-Haloperoxidase
a. Oxidative addition of halide ions to nucleophilic sites.
b. Addition of hypohalous acid to olefinic bond
c. Ring cleavage of cyclopropane
d. Activated aromatic substrates converted to ortho and para derivatives
e. 1,3 diketone converted to 2-halo-derivative
f. Heteroatom oxidation of sulfur and nitrogen containing substrates
g. Oxidation of enol acetate, alkyne and activated aromatic rings
7 Lignin peroxidase / diarylpropane peroxidase
a. Oxidative cleavage of CC bond
b. Oxidation of benzylic alcohols to aldehydes
c. Hydroxylation of benzyl carbon
d. Phenol dimerization
e. Formation of diol by hydroxylation of double bond
f. Cleavage of lignin aldehyde
8 Epoxide hydrolase
a. Enantiomerically pure biologically active compound
b. Regio- and Chiral Selective Hydrolysis of Epoxides
c. Epoxide formation by aromatic and olefin epoxidation by monooxydinase.
d. Resolution of racemic epoxide
e. Hydrolysis of steroid epoxide
9 Nitrile hydratase / nitrilase
a. Formation of carboxamides by hydrolysis of aliphatic nitriles.
b. Hydrolysis of aromatic, heterocyclic and unsaturated aliphatic nitriles to produce the corresponding acids
c. Hydrolysis of acrylonitrile
d. Production of aromatic and carboxamide, carboxylic acids (nicotinamide, picolinamide, isonicotinamide)
e. Regioselective hydrolysis of acryldinitrile
f. α-amino acids from α-hydroxynitrile
10 transaminase
a. Transfer of amino group to oxo acid
11 amidase / acylase
a. Hydrolysis of amides, amidines and other CN bonds
b. Unnatural amino acid resolution and synthesis
These exemplifications illustrate certain features of the invention, but are not meant to be limiting or limit the scope of the disclosed invention.
[0275]
Therefore, according to one aspect of the present invention, one or more demarcatim points are selected by aligning the sequences of a plurality of precursor nucleic acid templates. This demarcation point may be located in a region of homology, and may be composed of one or more nucleotides, and is further shared by at least two of the precursor templates. Boundary points can be used to define the limits of the nucleic acid building block to be generated. Thus, the boundary points identified and selected in the precursor molecule serve as potential chimera formation points in the set of progeny molecules.
[0276]
Preferably, a useful demarcation point is a region of homology (consisting of at least one homologous nucleotide base) shared by at least two precursor templates. More preferably, useful demarcation points are regions of homology that are shared by at least half of the precursor template. Still more preferably, useful demarcation points are regions of homology that are shared by at least two thirds of the precursor template. More preferably, useful demarcation points are regions of homology that are shared by at least three quarters of the precursor template. More preferably, useful demarcation points are regions of homology shared by almost all of the precursor templates. More preferably, useful demarcation points are regions of homology shared by all of the precursor templates.
[0277]
The design of the nucleic acid building blocks and the compatible ligation ends of the nucleic acid building blocks to be assembled are shown in FIGS. As shown, aligning the set of precursor templates reveals multiple naturally occurring boundary points, and the identification of the boundary points shared by these templates can be generated and used to generate progeny chimeric molecules. Helps determine non-stochastically the building blocks used.
[0278]
In a preferred embodiment, the invention is characterized in that the ligation reassembly method is thoroughly performed in order to generate a complete library. In other words, the nucleic acid building blocks in all possible order combinations are presented as a set of final chimeric nucleic acid molecules. At the same time, in a particularly preferred embodiment, the order of assembly in each combination (ie, the order of assembly of each building block in the 5 ′ → 3 ′ sequence of each final chimeric nucleic acid) is by design (or non-stochastic). is there. The non-stochastic nature of the present invention greatly reduces the potential for unwanted by-products.
[0279]
In another preferred embodiment, the present invention provides a systematic implementation of the ligation reassembly method, e.g., forming a systematically compartmentalized library, wherein compartments can be systematically sorted, e.g., one by one. Features. In other words, the present invention combines the selective and judicious use of specific nucleic acid building blocks with the selective and judicious use of sequential step-by-step assembly reactions so that a specific set of progeny products can An experimental design generated in each of the reaction vessels can be achieved. This makes it possible to carry out systematic assays and screening procedures. Thus, this allows perhaps a large number of progeny molecules to be systematically assayed in smaller groups than ever before.
[0280]
The ability to perform chimerization in a very flexible, yet thorough and systematic manner, especially when the homology between the precursor molecules is low, has led to the invention of a library comprising a large number of progeny molecules. (Or set) generation. Due to the non-stochastic nature of the linked reassembly invention, the resulting progeny molecule preferably comprises a library of final chimeric nucleic acid molecules having the overall assembly order selected by design. In a particularly preferred embodiment of the present invention, the generated library is preferably3These different progeny molecular species, more preferably 105These different progeny molecular species, and more preferably, 1010These different progeny molecular species, more preferably 10FifteenThese different progeny molecular species, more preferably 1020These different progeny molecular species, more preferably 1030These different progeny molecular species, more preferably 1040These different progeny molecular species, more preferably 1050These different progeny molecular species, more preferably 1060These different progeny molecular species, more preferably 1070These different progeny molecular species, more preferably 1080These different progeny molecular species, more preferably 10100These different progeny molecular species, more preferably 10110These different progeny molecular species, more preferably 10120These different progeny molecular species, more preferably 10130These different progeny molecular species, more preferably 10140These different progeny molecular species, more preferably 10150These different progeny molecular species, more preferably 10175These different progeny molecular species, more preferably 10200These different progeny molecular species, more preferably 10300These different progeny molecular species, more preferably 10400These different progeny molecular species, more preferably 10500These different progeny molecular species, more preferably 101000It consists of these different progeny molecular species.
[0281]
According to one aspect, the final set of chimeric nucleic acid molecules generated as described above consists of polynucleotides encoding polypeptides. According to one preferred embodiment, the polynucleotide is a gene, which may be a synthetic gene. In another preferred embodiment, the polynucleotide is a genetic pathway, which may be a synthetic genetic pathway. The invention features the incorporation of one or more synthetic genes produced according to the invention into a synthetic gene pathway, such as a path operable in eukaryotes (including plants).
[0282]
It should be noted that the power of the present invention is very good because of the great freedom in selection and control with respect to the choice of boundary points, the size and number of nucleic acid building blocks, and the size and design of the bonds. In addition, it should be noted that the operability of the present invention greatly reduces the requirement for intermolecular homology. In fact, even in regions with little or no intermolecular homology, boundary points can be selected. For example, nucleotide substitutions can be introduced into a nucleic acid building block without changing the amino acid originally encoded in the corresponding precursor template due to codon fluctuations, ie, codon degeneracy. Alternatively, the codons can be changed such that the coding of the original amino acid changes. The present invention now introduces such substitutions into nucleic acid building blocks to increase the incidence of homologous demarcation points between molecules and, thus, to increase the number of linkages achieved between building blocks. Is characterized by increasing the number of progeny chimeric molecules to be produced.
[0283]
In another aspect, the synthetic nature of the building block generation step allows for the design and introduction of nucleotides (eg, one or more nucleotides, such as codons or introns or regulatory sequences). These nucleotides can be optionally removed later by an in vitro method (for example, by mutagenesis) or an in vivo method (for example, by utilizing the gene splicing ability of a host organism). It should be noted that in many embodiments, the introduction of these nucleotides is preferred for a number of reasons, besides the potential for forming useful demarcation points.
[0284]
Thus, according to another embodiment, the invention features introducing an intron using a nucleic acid building block. Therefore, the present invention is characterized by introducing a functional intron into the synthetic gene of the present invention. The invention also features introducing a functional intron into the synthetic gene pathway of the invention. Thus, the present invention relates to the generation of chimeric polynucleotides that are synthetic genes containing one (or more) artificially introduced introns.
[0285]
Accordingly, the present invention also relates to the generation of chimeric polynucleotides that are synthetic gene pathways containing one (or more) artificially introduced introns. Preferably, the artificially introduced intron is functional in one or more host cells for gene splicing, much like a natural intron functions functionally in gene splicing. The present invention provides a method of producing a synthetic intron-containing polynucleotide to be introduced into a host organism for recombination and / or splicing.
[0286]
The ability to achieve chimerism using the couplings described herein in regions where there is little or no homology between precursor molecules is useful for assembly of new gene pathways and is in fact essential It is. The invention therefore relates to the generation of new synthetic gene pathways using synthetic ligation reassembly. In some forms, this is achieved by the introduction of regulatory sequences (such as promoters) operable in the host of interest, which, when introduced into the host of interest, impart operability to new gene pathways. You. In one aspect, the invention relates to the generation of novel synthetic gene pathways operable in multiple hosts of interest (eg, microorganisms and plant cells). This can be achieved, for example, by the introduction of a plurality of regulatory sequences operable in the first target host and regulatory sequences operable in the second target host. By performing a similar method, operability of the gene pathway can be achieved in the third target host species and the like. The number of target host species may be an integer between 1 and 10 or an integer of 10 or more. Alternatively, for example, operability of a gene pathway in a plurality of target hosts can be achieved by introducing a regulatory sequence having unique operability in the plurality of target hosts.
[0287]
Thus, in one embodiment, the invention features using a nucleic acid building block to introduce regulatory sequences, particularly regulatory sequences for gene expression. Preferred regulatory sequences include, but are not limited to, those synthetic and those found in archaebacteria, bacteria, eukaryotes (including mitochondria), viruses, and prions or prion-like organisms. Preferred regulatory sequences include, but are not limited to, promoters, operators, and activator binding sites. Therefore, the present invention is characterized by introducing a functional regulatory sequence into the synthetic gene of the present invention. The invention also features introducing a functional regulatory sequence into the synthetic gene pathway of the invention.
[0288]
Thus, the present invention relates to the generation of chimeric polynucleotides that are synthetic genes containing one (or more) artificially introduced regulatory sequences. Accordingly, the present invention also relates to the generation of chimeric polynucleotides that are synthetic gene pathways that include one (or more) artificially introduced regulatory sequences. Preferably, the artificially introduced regulatory sequences are operably linked to one or more genes of the synthetic polynucleotide and are functional in one or more host cells.
[0289]
Preferred bacterial promoters useful in the present invention include lacI, lacZ, T3, T7, gpt, lambda RR, PLAnd trp. Useful eukaryotic promoters include CMV immediate early, HSV thymidine kinase, early and late SV40, LTRs from retrovirus, and mouse metallotinein-I. Specific plant regulatory sequences include promoters that are active in directing transcription in plants, either constitutively or stepwise and / or tissue-specific, depending on the use of the plant or a portion thereof. These promoters include, but are not limited to, leaf-specific expression, such as the 35S promoter such as cauliflower mosaic virus (CaMV) (Guilley et al., 1982); Promoters for root-specific expression, such as promoters derived from the glutamine synthase gene (Tingey et al., 1987); and seed-specific expression promoters, such as Brassica napus cruciferae A promoter (Ryan et al., 1989). A promoter for tuber-specific expression, such as a potato-derived class I patatin promoter (Rocha-Sasa et al., 1989; Wenzler et al., 1989); or Promoters for fruit-specific expression, such as the tomato-derived polygalacturonase (PG) promoter (Bird et al., 1988).
[0290]
Other regulatory sequences preferred for the present invention include terminator sequences and polyadenylation signals, and any sequence that functions in plants, the choice of which can be made by one of skill in the art without difficulty. One example of such a sequence is the 3 'flanking region of the nopaline synthase (nos) gene of Agrobacterium tumefaciens. In addition, the regulatory sequence functions as an enhancer sequence such as that present in the CaMV 35S promoter, an mRNA stabilizing sequence such as the leader sequence of alfalfa mosaic virus (AlMV) RNA4 (Brederode et al., 1980), or the like. Other sequences are also included.
[0291]
A synthetic gene produced using the present invention can also be used as a substrate for recombination with another nucleic acid. Similarly, a synthetic gene pathway generated using the present invention can be used as a substrate for recombination with another nucleic acid. In a preferred example, recombination is facilitated by or occurs at a region of homology between the synthetic intron-containing gene and the nucleic acid that acts as a recombination partner. In a particularly preferred example, the recombination partner may be a nucleic acid produced according to the invention, such as a synthetic gene or a synthetic gene pathway. Recombination is facilitated by or occurs in a region of homology present in one (or more) of the introns artificially introduced into the synthetic gene.
[0292]
Although the synthetic ligation reassembly method of the invention utilizes a plurality of nucleic acid building blocks, each of these blocks preferably has two ligatable ends. The two ligatable ends of each nucleic acid building block may be two blunt ends (ie, each having a zero nucleotide overhang), or, preferably, one blunt end and one overhang, or more preferably Is also two overhangs.
[0293]
Useful overhangs for this purpose are 3 'overhangs or 5' overhangs. Thus, the nucleic acid building block is a 3 'overhang or 5' overhang, or two 3 'overhangs or two 5' overhangs. The overall order in which the nucleic acid building blocks are assembled to form the final chimeric nucleic acid molecule shall be determined by intentional experimental design and is not random.
[0294]
According to certain preferred embodiments, nucleic acid building is accomplished by chemically synthesizing two single-stranded nucleic acids (also referred to as single-stranded oligos), contacting and annealing them to form a double-stranded nucleic acid building block. Generate a block.
[0295]
Double-stranded nucleic acid building blocks can be of various sizes. The size of these building blocks can be varied by the choice of the experimenter. The preferred size of the building blocks ranges from 1 base pair (without overhangs) to 100,000 base pairs (without overhangs). In addition to the above, there is a size range in which the lower limit is 1 bp to 10,000 bp (including all integer values in this range) and the upper limit is 2 bp to 100,000 bp (including all integer values in this range). Provided.
[0296]
Note that these polymerase-based amplification methods can generate double-stranded nucleic acids up to thousands of base pairs in length with high fidelity, if not tens of thousands of base pairs. Chemical synthesis (eg, based on phosphoramidites) can be used to generate nucleic acids up to several hundred nucleotides in length with high fidelity. However, if desired, they can be constructed using, for example, overhangs or cohesive ends, and if not tens of thousands of base pairs, double-stranded nucleic acids up to several thousand base pairs in length can be used. Can be formed.
[0297]
According to the present invention, it is also possible to use the methods in combination (for example, chemical synthesis based on phosphoramidite and PCR). Thus, the progeny molecules of the present invention can also be generated using combinations of nucleic acid building blocks produced by various methods.
[0298]
The use of chemical synthesis to produce nucleic acid building blocks is particularly preferred in the present invention, while at the same time advantageous for other reasons such as process safety and ease. No cloning or collection or actual handling of biological samples is required. The design of nucleic acid building blocks can be performed on paper. Therefore, it can be seen that the present invention has advantages in the safety of the process in the recombinant technology.
[0299]
However, according to one preferred embodiment, the double-stranded nucleic acid building block according to the invention can also be generated by polymerase-based amplification of a polynucleotide template. In the non-limiting example shown in FIG. 2, the first set of primers, F2And R1Is performed to generate a blunt-end product (labeling reaction 1, product 1) that is approximately the same as product A. The second set of primers, F1And R2To produce a blunt-end product (labeling reaction 2, product 2) that is approximately the same as product B. The two products are mixed, melted and annealed to produce a double-stranded nucleic acid building block that has two overhangs and is expected to be useful. In the example of FIG. 2, a nuclease-based degradation of the other three products using a 3'-acting exonuclease such as exonuclease III selects a product with a 3 'overhang (product C). Also note that a 5'-acting exonuclease (e.g., red alpha) can be used, for example, to select product D instead. Further, selection means other than those described above, such as a hybridization-based means, may be used, and other means, such as a magnetic bead means, may be incorporated into these means to promote the separation of a desired product.
[0300]
There are many other ways to generate double-stranded nucleic acid building blocks useful in the present invention. These are known to those skilled in the art and can be easily implemented.
[0301]
According to a particularly preferred embodiment, a double-stranded nucleic acid building block useful in the present invention comprises first generating two single-stranded nucleic acids and then annealing them to form a double-stranded nucleic acid building block. I do. The two strands of the double-stranded nucleic acid building block are complementary on a nucleotide-by-nucleotide basis, except those that form an overhang, and thus contain no mismatches, except for overhangs. According to another embodiment, the two strands of the double-stranded nucleic acid building block are complementary at a lower rate than every nucleotide, except those that form an overhang. Thus, according to this embodiment, double-stranded nucleic acid building blocks are used to introduce codon degeneracy. Preferably, the codon degeneracy is achieved using one or more N, N, G / T cassettes, or using one or more N, N, N cassettes, using site saturation mutagenesis as described herein. Introduce using.
[0302]
Examples of experimental designs to achieve an ordered set according to the present invention include:
1) Design of specific nucleic acid building blocks,
2) Design of specific connecting ends of each nucleic acid building block,
3) Design of a specific order of the composition of the nucleic acid building block.
[0303]
The overhang may be a 3 'overhang or a 5' overhang. The overhang may also have a terminal phosphate group or may be free of a terminal phosphate group (instead, for example, have a hydroxyl group). The overhang may consist of any number of nucleotides. Preferably, the overhang consists of 0 nucleotides (like blunt ends) to 10,000 nucleotides. Thus, the size of the overhang can be used in a wide range. Therefore, the lower limit may be an integer from 1 to 200, and the upper limit may be an integer from 2 to 10,000. According to one particular example, an overhang can consist of any of 1 to 200 nucleotides (including all integers within the range).
[0304]
A final chimeric nucleic acid can be produced by sequentially assembling two or more building blocks until all designated building blocks have been assembled. Between the performance of the two assembly steps, the working sample may optionally be subjected to a size selection or purification step, or other selection or enrichment step. Alternatively, the final chimeric nucleic acid molecule can be generated by assembling all designated building blocks at once in one step.
[0305]
In in vitro shuffling
Similar to some standard gene conjugations can also be performed by in vitro shuffling. For example, "molecular backcrossing" can be performed by repeatedly mixing the hybrid nucleic acid with the wild-type nucleic acid while selecting the mutation of interest. As with traditional breeding, this technique can be used to combine phenotypes from different sources into a suitable background.
[0306]
This is useful, for example, to eliminate neutral mutations that affect unselected features (ie, immunogenicity). Thus, the above approach is useful in determining which mutations in a protein are involved in increased biological activity and which are not, which can be error-prone mutagenesis or cassette mutations. This is an advantage not achieved by the mutagenesis method.
[0307]
Large functional genes can be assembled precisely from a mixture of small random polynucleotides. This reaction is useful for reassortment of genes from highly fragmented DNA of fossils. In addition, random nucleic acid fragments taken from fossils may be combined with polynucleotides from similar genes from closely related species.
[0308]
Further, it is considered that the method of the present invention can be used for in vitro amplification of a whole genome derived from a single cell according to needs in various research and diagnostic fields. DNA amplification by PCR is actually limited to about 40 kb in length. Amplification of a whole genome such as E. coli (5,000 kb) by PCR would require approximately 250 primers to produce 125 40 kb polynucleotides. This technique is not practical because sufficient sequence data is not available. In contrast, random production of genomic polynucleotides using sexual PCR cycles, followed by gel purification of small polynucleotides, will result in a large number of potential primers. By using a mixture of random small polynucleotides as primers in a PCR reaction, alone or with the entire genome as a template, a single strand containing multiple copies of the genome is the theoretical endpoint. , The reverse chain reaction surely occurs.
[0309]
When only random polynucleotides are used, 100-fold copy number amplification and average polynucleotide size greater than 50 kb can be achieved. It is believed that the overlapping of a number of small polynucleotides produces larger concatemers. The quality of the particular PCR product obtained using the synthetic primers will be indistinguishable from the product obtained from unamplified DNA. This technique is expected to be useful for genome mapping.
[0310]
The polynucleotide to be shuffled can be generated as a random or non-random polynucleotide at the discretion of the experimenter.
[0311]
In Vivo shuffling
In an in vivo shuffling embodiment, at least two different nucleic acid sequences introduce a mixed population of a particular nucleic acid sequence into a bacterium or eukaryotic cell under the conditions present in each host cell. Polynucleotides can be introduced into host cells in a variety of ways. Host cells can be transformed with small polynucleotides using methods known to those skilled in the art, for example, treatment with calcium chloride. When inserting a polynucleotide into the phage genome, host cells can be transfected with a recombinant phage genome having a particular nucleic acid sequence. Alternatively, nucleic acid sequences can be introduced using means such as electroporation, transfection, lipofection, biolistics, conjugation, and the like.
[0312]
Generally, in this embodiment, the particular nucleic acid sequence is in a vector capable of stably replicating the sequence in a host cell. In addition, the vector will encode a marker gene such that a host cell having the vector is selected. This ensures recovery of the mutated specific nucleic acid sequence after introduction into the host cell. However, it is not considered that the entire mixed population of a particular nucleic acid sequence need be present on the vector sequence. Rather, after introduction of the polynucleotide into the host cells, a sufficient number of sequences are added to the vector to ensure that each host cell contains one vector having at least one particular nucleic acid sequence present therein. It needs to be cloned. Rather than cloning a subset of the population of specific nucleic acid sequences into a vector, the subset may be stably integrated into the host cell.
[0313]
It has been found that the insertion of two polynucleotides having regions of identity into a host cell results in homologous recombination between the two polynucleotides. Such recombination occurring between the two mutated specific nucleic acid sequences results in the production of double or triple hybrids, depending on the situation.
[0314]
It has also been found that when some of the mutated specific nucleic acid sequences are present on linear nucleic acid molecules, the frequency of recombination increases. Thus, in a preferred embodiment, some of the specific nucleic acid sequences are on a linear polynucleotide.
[0315]
After transformation, the host cell transformants are subjected to selection to identify host cell transformants containing the mutated specific nucleic acid having the desired quality. For example, if high resistance to a particular drug is desired, the transformed host cells are exposed to a high concentration of the drug and a transformant that produces a mutant protein that can confer high drug resistance is selected. I do. If a high ability to bind the receptor for a particular protein is desired, expression of the protein is induced from the transformant and the resulting protein is assayed in a ligand binding assay by methods known to those skilled in the art. Identify a subset of the mutant population that shows high binding to the ligand. Alternatively, the protein can be expressed in another system to ensure proper processing.
[0316]
After a subset of the first recombinant specific nucleic acid sequence (daughter sequence) having the desired characteristics is identified, it is subjected to a second round of recombination.
[0317]
In the second cycle of recombination, the recombinant specific nucleic acid sequence is mixed with the original mutant specific nucleic acid sequence (parent sequence) and the cycle is repeated as described above. In this way, a second set of recombinant specific nucleic acid sequences can be identified which has an enhanced property or which encodes a protein having the enhanced property. This cycle can be repeated as many times as desired.
[0318]
It is also conceivable to carry out a backcross in a second or subsequent recombination cycle. Molecular backcrossing involves mixing the desired specific nucleic acid sequence with a number of wild-type sequences so that the at least one wild-type nucleic acid sequence and the mutated nucleic acid sequence are present in the same host cell after transformation. Can be implemented. Recombination with a wild-type specific nucleic acid sequence eliminates neutral mutations that act on unselected features, such as immunogenicity, but do not affect selected features.
[0319]
In another embodiment of the present invention, during a first round, a subset of specific nucleic acid sequences may be produced as small polynucleotides by slowing or stopping PCR amplification prior to introduction into a host cell. it can. The size of the polynucleotide must be large enough to contain some region of identity with the other sequence so that it can recombine homologously with the other sequence. The size of the polynucleotide ranges from 0.03 kb to 100 kb, more preferably from 0.2 kb to 10 kb. It is also contemplated that in subsequent rounds, all specific nucleic acid sequences except those selected from the previous round may be used to generate a PCR polynucleotide prior to introduction into a host cell.
[0320]
Short polynucleotide sequences can be single-stranded or double-stranded. When a sequence that was originally single-stranded becomes double-stranded, it can be denatured using heat, chemicals, or enzymes before insertion into host cells. Suitable reaction conditions for separating nucleic acid strands are known to those skilled in the art.
[0321]
The steps of the method can be repeated indefinitely, but are limited only by the number of hybrids that can be achieved. After all possible hybrids have been achieved after a predetermined number of cycles, further cycles are redundant.
[0322]
In certain embodiments, the same mutated template nucleic acid is repeatedly recombined, and the resulting recombinant is selected for a desired characteristic.
[0323]
Thus, an initial pool or population of mutant template nucleic acids is cloned into a vector capable of replicating in bacteria such as E. coli. The vector is not particularly limited as long as autonomous replication is possible in E. coli. In a preferred embodiment, the vector is designed to allow expression and production of the protein encoded by the particular mutated nucleic acid linked to the vector. Further, the vector preferably contains a gene encoding a selectable marker.
[0324]
A population of vectors containing a pool of mutated nucleic acid sequences is introduced into E. coli host cells. Vector nucleic acid sequences can be introduced by transformation, transfection, or, in the case of phage, infection. The concentration of the vector used to transform the bacteria is such that a number of vectors are introduced into each cell. Once present in the cell, the homologous recombination efficiency is such that homologous recombination occurs between the various vectors. This produces a hybrid (daughter) with a different combination of mutations than the original parent sequence that has mutated.
[0325]
Next, the host cell is cloned cloned and selected for a marker gene present in the vector. Under this selection, only cells with the plasmid will grow.
[0326]
Next, the host cells containing the vector are tested for the presence of the preferred mutation. For example, if the gene to be selected is a gene with improved drug resistance, such a test would consist of subjecting the cells to selective pressure. If the vector allows the expression of the protein encoded by the mutated nucleic acid sequence, such a choice is made by the expression of the protein thus encoded, the isolation of the protein, and the Tests to determine if they bind with high efficiency to the ligand of interest.
[0327]
After identifying the particular mutated daughter nucleic acid sequence that confers the desired characteristics, the nucleic acid previously isolated or isolated from the vector is isolated. The nucleic acid is then mixed with the first or parent population of nucleic acids and the cycle is repeated.
[0328]
It has been shown that this method allows the selection of nucleic acid sequences with enhanced desired properties.
[0329]
In another embodiment, the first generation of the hybrid is retained in the cell and the mutated parent sequence is added back to the cell. Therefore, the first cycle of the embodiment I is performed as described above. However, after identifying the daughter nucleic acid sequences, the host cells containing these sequences are retained.
[0330]
The mutated parent specific nucleic acid population is introduced as a polynucleotide or cloned into the same vector into a host cell that already contains the daughter nucleic acid. Intracellular recombination is allowed to occur, and the next generation of recombinants, granddaughters, is selected by the methods described above.
[0331]
This cycle can be repeated many times until a nucleic acid or peptide with the desired characteristics is obtained. In subsequent cycles, the population of mutated sequences added to the preferred hybrid may be from the parent hybrid, or from any subsequent generation.
[0332]
In another embodiment, the invention provides a method of performing a "molecular" backcross of the resulting recombinant specific nucleic acid to eliminate any neutral mutations. Neutral mutations are mutations that do not confer the desired properties on the nucleic acid or peptide. However, such mutations can confer undesired properties on the nucleic acid or peptide. Therefore, it is preferable to eliminate these neutral mutations. The method of the present invention provides a means for performing it.
[0333]
In this embodiment, after obtaining a hybrid nucleic acid having desired characteristics by the method of this embodiment, a nucleic acid, a vector having the nucleic acid, or a host cell containing the vector and the nucleic acid is isolated.
[0334]
Next, the nucleic acid or vector is introduced into a host cell that contains a large excess of wild-type nucleic acid. The hybrid nucleic acid and the wild-type sequence nucleic acid undergo recombination. The resulting recombinant is placed under the same selection as the hybrid nucleic acid. Only those recombinants that retain the desired characteristics will be selected. Recombination with wild-type DNA eliminates silent mutations that do not confer the desired characteristics. This cycle can be repeated many times until all silent mutations are eliminated.
[0335]
Thus, the method of the invention can be used for molecular backcrossing to eliminate unwanted or silent mutations.
[0336]
Usefulness
The in vivo recombination method of the invention can be performed in a blind fashion on a pool of unknown hybrids or alleles of a particular polynucleotide or sequence. However, it is not necessary to know the actual DNA or RNA sequence of a particular polynucleotide.
[0337]
Techniques using recombination within a mixed population of genes are useful for the production of any useful protein, such as interleukin I, antibodies, tPA and growth hormone. This technique can be used to generate proteins with altered specificity or activity. This technique is also useful for generating hybrid nucleic acid sequences of a gene, for example, promoter regions, introns, exons, enhancer sequences, 31 untranslated regions or 51 untranslated regions. Thus, this approach can be used to generate genes with a high rate of expression. This technique is also useful for studying repetitive DNA sequences. Finally, this technique is useful for mutating ribozymes or aptamers.
[0338]
Scaffold-like regions that separate regions of diversity are particularly suitable for the method of the invention. The conserved scaffold determines the overall fold by self-association and displays a relatively unrestricted loop that mediates specific binding. Examples of such scaffolds are the immunoglobulin beta barrel, and a four-helix bundle. Using the methods of the present invention, scaffold-like proteins having various combinations of mutated sequences for binding can be generated.
[0339]
The same standard gene conjugation can be performed by the method of the present invention. For example, by mixing a hybrid nucleic acid with a wild-type nucleic acid, the “molecular” backcross is repeated and the mutation of interest is selected. As with traditional breeding, this approach can be used to incorporate phenotypes from various sources into a selection background. This is useful, for example, for removing neutral mutations that affect unselected characteristics (ie, immunogenicity). Thus, it is useful to determine which mutations in a protein are involved in increased biological activity and which are not.
[0340]
Peptide display method
The present invention can be used to shuffle a polynucleotide sequence selected by a peptide display method by in vitro and / or in vivo recombination using any of the above methods, and any combination. The peptide display method is characterized in that the associated polynucleotide encodes a display peptide that is selected for a certain phenotype (eg, a predetermined receptor (ligand) affinity).
[0341]
An increasingly important aspect of biopharmaceutical drug development and molecular biology is the identification of peptide structures, including the primary amino acid sequences of peptides or pseudopeptides that interact with biological macromolecules. It is. One method of identifying a peptide having a desired structural or functional property, such as binding to a predetermined biological macromolecule (eg, a receptor), involves identifying the desired structural or functional property given by the amino acid sequence of the peptide. Screening large libraries or peptides for individual library members.
[0342]
In addition to directional chemical synthesis methods for generating peptide libraries, several recombinant DNA methods have also been reported. One of them consists of displaying peptide sequences, antibodies, or other proteins on the surface of bacteriophage particles or cells. Generally, in these methods, each bacteriophage particle or cell acts as a separate library member displaying a single species of display peptide in addition to the native bacteriophage or cellular protein sequence. Each bacteriophage or cell contains nucleotide sequence information encoding a particular display peptide sequence. Thus, the displayed peptide sequence can be found by nucleotide sequencing of the isolated library member.
[0343]
Known peptide display methods typically involve displaying the peptide sequence on the surface of a filamentous bacteriophage, such as a fusion with a bacteriophage coat protein. A bacteriophage library is incubated with an immobilized macromolecule or small molecule (eg, a receptor) and binds bacteriophage particles exhibiting peptide sequences that bind to the immobilized macromolecule to a predetermined macromolecule. Can be classified from those which do not show the peptide sequence to be expressed. The bacteriophage particles (ie, library members) bound to the immobilized macromolecules are then recovered and replicated to amplify the selected bacteriophage subpopulation, which is then transferred to the next round of affinity rich And subjected to phage replication. After several rounds of affinity enrichment and phage replication, the bacteriophage library members thus selected are isolated, and the predetermined macromolecules ( For example, the sequence of the peptide that binds to the receptor is identified. Such methods are described in further detail in PCT patent publications WO 91/17271, WO 91/18980, WO 91/19818 and WO 93/08278.
[0344]
The latter PCT publication describes a recombinant DNA method for peptide ligand display, which consists of generating a library of fusion proteins. Each of the fusion proteins has a first polypeptide portion containing various sequences available for binding to a predetermined macromolecule, and a second polypeptide that binds to a DNA, such as a DNA vector, encoding the individual fusion protein. It is made up of parts. When the transformed host cell is cultured under conditions that allow expression of the fusion protein, the fusion protein will bind to the DNA vector encoding it. When the host cells are lysed, the fusion protein / vector DNA complex can be sorted against a predetermined macromolecule, much like sorting bacteriophage particles in a phage-based display system. In this way, replication and sequencing of the DNA vector in the selected fusion protein / vector DNA complex serves as a basis for the identification of the selected library peptide sequence.
[0345]
Peptide libraries, and other systems that produce similar polymers, have the characteristics of both recombinant and in vitro chemical synthesis methods. These hybrid methods use a cell-free enzymatic mechanism to achieve in vitro synthesis of library members (ie, peptides or polynucleotides). In one approach, RNA molecules with the ability to bind a predetermined protein or predetermined dye molecule were selected by alternately performing selection and PCR amplification cycles (Tuerk and Gold, 1990; Ellington and Szostak, 1990). . A similar method was used to identify DNA sequences that bind predetermined human transcription factors (Thiesen and Bach, 1990; Beaudry and Joyce, 1992; PCT Patent Publication Nos. WO92 / 05258 and WO92 / 14843). Similarly, a target protein has been synthesized using in vitro translation technology, and this technology has been proposed as a method for forming a large library of peptides. In general, these methods based on in vitro translation involving stabilized polysome complexes are described in PCT patent publications WO 88/08453, WO 90/05785, WO 90/07003, WO 91/02076, WO 91/05058, and WO 92/02536. In more detail. Applicants describe a method wherein the library member comprises a fusion protein having a first polypeptide portion with DNA binding activity and a second polypeptide portion having a unique peptide sequence for the library member. Such methods are particularly suited for use in a cell-free in vitro selection format.
[0346]
The displayed peptide sequences can be of various lengths, typically from 3 to 5,000 amino acids in length or longer, often from 5 to 100 amino acids in length, and even from 8 to 15 amino acids in length. is there. The library can be composed of library members having various lengths of the displayed peptide sequence, or can be composed of library members having a fixed length of the displayed peptide sequence. Part or all of the displayed peptide sequences may be random, pseudo-random, defined set nuclei, fixed ones, or the like. This display method includes in vitro and in vivo display methods for single-chain antibodies such as the initial scFv on polysomes or the scfv displayed on phage, but these display methods involve a very wide variety of variable regions. Enables large-scale screening of scfv libraries with sequence and binding specificity.
[0347]
The invention also provides libraries of random, pseudorandom, and defined sequence framework peptides, and the generation and screening of these libraries to modify receptor or target molecules to target peptides or RNA as desired. Methods are provided for identifying useful compounds (eg, peptides, including single chain antibodies) that bind to an epitope, or gene product. Random, pseudorandom, and defined sequence framework peptides are generated from a library of peptide library members. The members include a display peptide or a display single chain antibody bound to a polynucleotide template from which the display peptide was synthesized. The binding method may be changed according to the selected specific embodiment of the present invention, and examples thereof include an envelope in phage particles and incorporation into cells.
[0348]
The affinity enrichment method allows one to screen very large libraries of peptides and single-chain antibodies, and to select polynucleotide sequences encoding the desired peptide or single-chain antibody. The polynucleotide is then isolated and shuffled to complex recombine the amino acid sequence of the selected peptide (or predetermined portion thereof) or single chain antibody (or only the VHI, VLI or CDR portions thereof). You. Using these methods, peptides or single-chain antibodies can be identified as having the desired binding affinity for one molecule, and the desired high-affinity peptide or It is possible to converge to scfv. The peptide or antibody can then be synthesized and bulk synthesized by conventional means for a suitable application (eg, a drug or diagnostic agent).
[0349]
An important advantage of the present invention is that isolating a peptide ligand or antibody of interest does not require preliminary information on the expected ligand structure. The identified peptides have biological activity, i.e., contain at least a specific binding affinity for the selected receptor molecule, but also have the ability to block the binding of other compounds, stimulate or inhibit metabolic pathways Ability to act as a signal or messenger, to stimulate or block cellular activity, and the like.
[0350]
The present invention also relates to an intercellular protein that binds to a predetermined receptor (eg, a peptidic hormone receptor, a cell surface receptor, another protein to form an intercellular protein complex such as a heterodimer) For library members that bind to such mammalian proteinaceous receptors) or epitopes (eg, immobilized proteins, glycoproteins, oligosaccharides, etc.), a library of polysomes displaying the initial peptide (single-chain antibody) Affinity screening provides a method for shuffling a pool of selected polynucleotide sequences.
[0351]
By any of these methods, the polynucleotide sequences selected in the first round of selection (typically by affinity selection for binding to a receptor (eg, ligand)) are pooled, and the pool is pooled in vitro and And / or shuffled by in vivo recombination to produce a shuffled pool containing a population of recombinant selected polynucleotide sequences. The recombined selection polynucleotide sequence is subjected to at least one subsequent round of selection. The polynucleotide sequences selected in later rounds of selection are used directly for sequencing and / or for one or more rounds of shuffling and the next round of selection. The selected sequence can also be backcrossed with a polynucleotide sequence that encodes a neutral sequence (ie, has a functional effect that is not required for binding). This backcrossing can be performed, for example, by backcrossing using wild-type or naturally-occurring sequences that are approximately the same as the selected sequence, to produce a less immunogenic, naturally-like functional peptide. Generally, during the backcross, the next round of selection is performed to retain the predetermined binding properties to the receptor (ligand).
[0352]
Mutations can be induced in the sequence before or simultaneously with shuffling of the selected sequence. In some embodiments, the selected library members are cloned into a prokaryotic vector (eg, a plasmid, phagemid, or bacteriophage). In this embodiment, individual colony (or plaque) populations representing individual library members are generated. The individual selected library members can then be manipulated (eg, site-directed mutagenesis, cassette mutagenesis, chemical mutagenesis, PCR mutagenesis, etc.) based on the sequence of the selected library member. A population of library members that exhibit a nucleus of sequence diversity can be generated. By manipulating the sequences of the individual selection library members or pools, one can obtain random, pseudo-random, defined nuclear mutations (ie, variable and constant) partially or over the entire length of the individual selection library member sequence. (Including variable residue positions that include residue positions and / or may contain residues selected from a defined subset of amino acid residues), codon-based mutations, and the like. The mutagenized selected library members are then shuffled by in vitro and / or in vivo recombination shuffling as described herein.
[0353]
The present invention also provides a peptide library comprising a plurality of individual library members of the present invention, wherein (1) each of the plurality of individual library members is generated by shuffling a pool of selected sequences. (2) each individual library member has a variable peptide segment sequence or single chain antibody segment sequence that is different from the variable peptide segment sequence or single chain antibody sequence of the other individual library members in the plurality of members. (However, one or more library members may be present more than once per library due to heterogeneous amplification, stochastic probability, etc.).
[0354]
Further, the present invention provides a step-by-step product, wherein the predetermined binding specificity is formed by the following method: (1) a predetermined receptor (eg, a ligand) ) Or epitopes (eg, antigenic macromolecules) by screening displayed peptides or displayed single-chain antibody libraries to identify library members that bind to predetermined receptors or epitopes and / or Enrich to generate a pool of selected library members, and (2) bind to a predetermined epitope, thereby isolating and / or enriching the selected library members (or amplification) from the library Or the cloned copy) is shuffled by recombination to generate a shuffle library, (3) Screening the shuffle library against a defined receptor (eg, ligand) or epitope (eg, antigenic macromolecule) to identify and / or identify shuffle library members that bind to the predetermined receptor or epitope. Enrich to generate a pool of selected shuffle library members.
[0355]
Antibody display and screening method
The present invention can be used to shuffle polynucleotide sequences selected by the antibody display method by in vitro and / or in vitro recombination by any of the methods described, and by any combination, wherein The associated polynucleotide encodes an displayed antibody that has been screened for a phenotype (eg, affinity) that binds the predetermined antibody (ligand).
[0356]
Various molecular genetic approaches have been devised to obtain a vast immune repertoire, represented by the vast number of individual variable regions that can be present in an immunoglobulin chain. The naturally occurring germline immunoglobulin heavy chain locus is composed of individual tandem variable segment genes located upstream of the tandem diversity segment gene. The diversity segment gene itself is located upstream of the tandem linked (i) region gene, and this linked region gene is located upstream of the constant region gene. During B lymphocyte development, VDJ transposition occurs, with transposition forming a fused D segment followed by transposition at the V segment forming the VDJ binding product gene, resulting in heavy duplication. A chain variable region gene (VH) is formed. In addition, the VDJ binding product gene encodes a functional variable region (VH) of a heavy chain when productively transposed. Similarly, a light chain locus rearranges one of the plurality of V segments with one of the plurality of J segments to form a gene encoding the light chain variable region (VL).
[0357]
The vast repertoire of variable regions that can occur in immunoglobulins is due to the large number of possible combinations of linked V and i segments (and, in the case of heavy chain loci, D segments) during reconstitution in B cell development. Some are derived. Apart from this, the sequence diversity of the heavy chain variable region is due to the heterogeneous rearrangement of the D segment during the VDJ junction and the addition of the N region. In addition, antibody selection for specific B cell clones selects for higher affinity variants with non-germline mutations in one or both of the heavy and light chain variable regions ("affinity maturation" or A phenomenon called “affinity sharpening”). Typically, these "affinity sharpening" mutations cluster in specific areas of the variable region, most commonly complementarity determining regions (CDRs).
[0358]
Various prokaryotic expression systems have been developed to address a number of limitations in the production and identification of high affinity immunoglobulins via antigen-stimulated β-cell development (ie, immunity). One can generate a combinatorial antibody library that is screened to select for high affinity antibodies to a specific antigen. Recent advances in the expression of antibodies in E. coli and bacteriophage systems (see “Alternative Peptide Display Methods,” below) have enabled the cloning of antibody genes from characterized hybridomas or antibody gene libraries (eg, Ig Ig). Either of the de novo selections (from cDNA) has the potential to give almost all specificity.
[0359]
Antibody combinatorial libraries have been generated in bacteriophage λ expression systems that can be screened as bacteriophage plaques or colonies of lysogens (Huse et al., 1989; Canton and Koprowski, 1990; Mullinax et al., 1990; Persson et al., 1991). ). Various embodiments of bacteriophage antibody display libraries and phage lambda expression libraries have been described (Kang et al., 1991; Clackson et al., 1991; McCafferty et al., 1990; Burton et al., 1991; Hoogenboom et al., 1991; Chang et al. Markings et al., 1991; Marks et al., 1991, p. 581; Barbas et al., 1992; Hawkins and Winter, 1992; Marks et al., 1992, p.779; Marks et al., 1992, p. 16007; 1991; Lerner et al., 1992; all of which are incorporated herein by reference). Typically, bacteriophage antibody display libraries are immobilized (eg, by covalently attaching to a chromatography resin and enriching for reactive phage by affinity chromatography) and / or labeled ( For example, screening with receptors (eg, polypeptides, carbohydrates, glycoproteins, nucleic acids) to screen for plaques or colony lifts.
[0360]
A particularly advantageous approach is the use of so-called single chain fragment variable (scfv) libraries (Marks et al., 1992, p. 779; Winter and Milstein, 1991; Clackson et al., 1991; Marks et al., 1991, p. 581). Chaudhary et al .; Chiswell et al., 1992; McCafferty et al., 1990; and Huston et al., 1988). Various embodiments of the scfv library displayed on bacteriophage coat proteins have been described.
[0361]
Since 1988, single-chain analogs of Fv fragments and their fusion proteins have been produced with high reliability by antibody engineering. The first step generally consists of obtaining genes encoding VH and VL with the desired binding properties. These V genes can be selected from a combinatorial V gene library or isolated from a specific hybridoma cell line created by V gene synthesis. Single-chain Fv is formed by linking an oligonucleotide encoding a suitably designed linker peptide, such as (Gly-Gly-Gly-Gly-Ser) 3 or an equivalent linker peptide, to a component V gene. Is done. The linker bridges the C-terminus of the first V region and the N-terminus of the second region in the order of VH-linker-VL or VL-linker-VH '. In principle, a scfv binding site can faithfully replicate both the affinity and specificity of its parent antibody binding site.
[0362]
Thus, scfv fragments are composed of VH and VL domains linked to a single polypeptide chain by a flexible linker peptide. After constructing the scfv genes, they are cloned into phagemids and expressed at the tip of M13 phage (or similar filamentous bacteriophage) as a fusion protein containing the bacteriophage PIII (gene 3) coat protein. Enrichment of phage expressing the antibody of interest is achieved by selecting for recombinant phage displaying a population scfv for binding to a predetermined epitope (eg, target antigen, receptor).
[0363]
The binding polypeptide of a library member, after a screening or selection procedure, provides a basis for the replication of the library member and provides a basis for determining the identity of the displayed peptide sequence or VH and VL amino acid sequences. The displayed peptide sequences, or single-chain antibodies (eg, scfv) and / or their VH and VH domains, or their CDRs, can be cloned and expressed in a suitable expression system. Generally, the polynucleotides encoding the isolated VH and VL domains are linked to polynucleotides encoding the constant regions (CH and CL) to form a complete antibody (eg, chimeric or fully human), antibody A polynucleotide encoding a fragment or the like is prepared. Also, generally, the isolated CDR-encoding polynucleotides are grafted onto a polynucleotide encoding a suitable variable region framework (and, optionally, a constant region) to form a complete antibody (eg, humanized or , Fully human), polynucleotides encoding antibody frameworks and the like. The prepared amount of the antigen can be separated by immunoaffinity chromatography using the antibody. Various uses of these antibodies other than those described above include the diagnosis and / or staging of disease (eg, neoplasia) and the treatment of disease (eg, neoplasia, autoimmune disease, AIDS, cardiovascular disease, infection, etc.). There is use for.
[0364]
Various methods have been reported to increase the combinatorial diversity of scfv libraries to extend the repertoire (idiotypic spectrum) of binding species. By using PCR, the variable regions can be rapidly cloned from specific hybridoma sources or as a gene library from non-immune cells and combined sequences of VH and VL cassettes that can be combined. Brings diversity. In addition, VH and VL cassettes can themselves be diversified, such as by random, pseudo-random, or directed mutagenesis. Typically, VH and VL cassettes diversify in or near the complementarity determining regions (CDRs), but often diversify in the third CDR, CDR3. Enzymatic inverse PCR mutagenesis, like error-prone PCR and chemical mutagenesis (Deng et al., 1994), is simple and reliable to form a relatively large library of scfv site-directed hybrids. It has been shown to be a highly efficient method (Stemmer et al., 1993). Riechmann (Riechmann et al., 1993) demonstrated a semi-rational design of antibody scfv fragments using condensed oligonucleotide PCR followed by site-directed randomization by phage display of the resulting scfv hybrids. Barbas (Barbas et al., 1992) sought to address the problem of repertoire size limitations due to the use of biased variable region sequences by randomizing sequences within the synthetic CDR regions of the human tetanus toxoid-binding Fab.
[0365]
Approximately 1 × 10 5 for heavy chain CDR3 alone by CDR randomization20CDRs, approximately the same number of heavy chain CDR1 and CDR2 variants, and light chain CDR1-3 variants may be produced. The possibility of combining CDR randomization of heavy and / or light chains, used individually or together, creates a large number of bacteriophage clones and creates a clonal library displaying all possible combinations. Need that. Most of these are non-binding. Generating such a large number of primary transformed cells is not feasible with current transformation techniques and bacteriophage display systems. For example, Barbas (Barbas et al., 1992) is 5 × 107Yielded only a fraction of the potential diversity of the fully randomized CDR library.
[0366]
Despite these significant limitations, various useful antibodies and antibody fusion proteins have already been obtained by bacteriophage display of scfv. Bispecific single-chain antibodies have been shown to mediate efficient tumor cell lysis (Gruber et al., 1994). Intracellular expression of anti-Rev scfv inhibits in vitro HIV-1 virus replication (Duan et al., 1994), and intracellular expression of anti-p21lar, scfv inhibits meiosis in Xenopus oocytes. (Biocca et al., 1993). Also, recombinant scfv that can be used to diagnose HIV infection has been reported, demonstrating the diagnostic utility of scfv (Lillley et al., 1994). Fusion proteins that bind scFv to a second polynucleotide, such as toxins and fibrinolytic activator proteins, have also been reported (Holvost et al., 1992; Nicholls et al., 1993).
[0367]
The ability to generate scFvs that have a wide range of antibody diversity and that address many of the limitations of conventional CDR mutagenesis and randomization methods that can handle only a small fraction of the possible sequence combinations would be therapeutic and diagnostic. Could significantly improve the number and quality of scfv suitable for use in To address this issue, the in vitro and in vivo shuffling methods of the invention are used to recombine CDRs (typically through PCR amplification or cloning) obtained from nucleic acids from selected display antibodies. Such display antibodies can be displayed on cells, bacteriophage particles, polysomes, or any suitable antibody display system in which the antibody carries its encoding nucleic acid. In some embodiments, the CDRs initially produce antibody-producing cells (eg, immunized wild-type mice, humans, or human antibodies as described in WO 92/03918, WO 93/12227 and WO 94/25585). Obtained from mRNA (or cDNA) from plasma cells / splenocytes from possible transgenic mice (including hybridomas derived therefrom).
[0368]
By any of the methods described above, the polynucleotide sequences selected in the first selection round (typically by affinity selection of displayed antibodies that bind to the antigen (eg, ligand)) are pooled and the pool is pooled in vitro. And / or by in vivo recombination, in particular shuffling the CDRs (typically by shuffling the heavy chain CDRs with other heavy chain CDRs and the light chain CDRs with other light chain CDRs), A shuffled pool consisting of a population of selected polynucleotide sequences is generated. The recombinant selection polynucleotide sequence is expressed as a display antibody in a selection format and then subjected to at least one selection round. The polynucleotide sequences selected in later rounds of selection are used directly, sequenced and / or subjected to one or more additional rounds of shuffling and selection until the desired binding affinity is obtained. The selected sequence is backcrossed with a polynucleotide sequence encoding a neutral antibody framework sequence (ie, one that exerts an unnecessary functional effect on antigen binding), for example, by backcrossing using the human variable region framework. It is also possible to produce human-like sequence antibodies. In general, during the backcross, the following selections are made to retain the binding properties for the predetermined antigen.
[0369]
Alternatively, or in combination with the above embodiments, the antibody titer of the target epitope can be varied to control the average binding affinity of the selected scfv library member. The target epitope can be bound to a surface or substrate at varying densities, such as by the inclusion, dilution, or other methods known to those skilled in the art, of a competing epitope. Low density (antibody titer) preferentially enriches the scaffv library members with higher affinity, whereas relatively high affinity (antibody titer) with relatively low affinity using predetermined epitopes The scfv library members can be enriched.
[0370]
To generate a variety of variable segments, a population of synthetic oligonucleotides encoding a random, pseudo-random, or defined sequence core set of peptide sequences may be inserted by ligation into predetermined sites (eg, CDRs). it can. Similarly, by mutating CDRs, such as by site-directed mutagenesis or CDR substitution, it is possible to expand the sequence diversity of one or more CDRs of the single-chain antibody cassette. The resulting DNA molecule can be propagated in a host for cloning and amplification prior to shuffling, or can be used directly (i.e., avoid possible loss of diversity when growing in host cells); Next, the selected library members are shuffled.
[0371]
The displayed peptide / polynucleotide complex (library member) encoding the variable segment peptide sequence of interest, or the single chain antibody of interest, is selected from the library by an affinity enrichment method. This is accomplished using immobilized macromolecules or epitopes specific for the peptide sequence of interest, such as receptors and other macromolecules, or other epitope species. By repeating the affinity selection procedure, enrichment of library members encoding the desired sequence is achieved, and these members are isolated and pooled and shuffled, sequenced, and / or further amplified and affinity enriched Is possible.
[0372]
Library members without the desired specificity are removed by washing. The degree of washing and stringency required will depend on each peptide sequence or single-chain antibody of interest, as well as on the immobilized and predetermined macromolecule or epitope. By adjusting the conditions of the binding incubation and subsequent washing, some control can be exerted on the binding properties of the recovered generated peptide / DNA complex. Temperature, pH, ionic strength, divalent cation concentration, and amount and time of washing are selected for the generated peptide / DNA complex within a specified range of the affinity of the immobilized macromolecule. Selection based on slow off-rates usually predicts high affinity, but is often the most practical method. This can be done either by continuous incubation in the presence of a saturating amount of the predetermined free macromolecule, or by increasing the amount, number and time of washing. In each case, the binding of the dissociated initial peptide / DNA or peptide / RNA complex is inhibited, and the longer the time, the higher the affinity of the generated peptide / DNA or peptide / RNA complex is recovered.
[0373]
The binding and washing procedures can be further modified to obtain peptides with special characteristics. For some peptides, the affinity depends on ionic strength or cation concentration. This is a useful feature for peptides used for affinity purification of various proteins when mild conditions are required to remove proteins from the peptides.
[0374]
In some embodiments, the use of multiple binding targets (multiple epitope species, multiple receptor species) allows the scfv library to be screened simultaneously for multiple scfv with different binding specificities. Because the size of the scfv library limits the diversity of the scfv sequence that can be expected, it is typically desirable to use a scfv library that is as large as possible. The time and economic requirements for generating a given number of very large polysome scfv display libraries are enormous. To avoid this significant problem, a plurality of predetermined epitope species (receptor species) can be screened simultaneously in a single library, or a sequential screen can be performed for a given number of epitope species. In some embodiments, multiple target epitope species, each encoded on individual beads (or a subset of beads), can be mixed and incubated with a polysome-displayed scfv library under appropriate binding conditions. A population of beads containing multiple epitope species can be used to isolate scfv library members by affinity selection. In general, subsequent affinity screening rounds may involve the same mixture of beads, a subset thereof, or beads containing one or two individual epitope species. This approach allows for efficient screening and is compatible with laboratory automation, batch processing, and high-throughput screening methods.
[0375]
In the present invention, various methods are used to diversify the peptide library or single-chain antibody library, or to diversify the almost variable segment peptides obtained in the initial selection round before or simultaneously with shuffling. Thus, sufficient binding activity to a predetermined macromolecule or epitope can be obtained. In one approach, the positive selection peptide / polynucleotide complex (identified in the initial round of affinity enhancement) is sequenced to determine the identity of the active peptide. Oligonucleotides are then synthesized based on these active peptide sequences, using low levels of all bases incorporated in each step to generate minor mutations of the primary oligonucleotide sequence. This mixture of (mild) condensed oligonucleotides at the appropriate location is cloned into the variable segment sequence. This method can generate systematic, controlled mutations of the starting peptide sequence, which can then be shuffled. However, this requires that the individual positive initial peptide / polynucleotide complexes be sequenced prior to mutagenesis, thus expanding the diversity of the small number of recovered complexes and increasing affinity and / or Useful for selecting variants with higher binding specificity. In some embodiments, a positive selection peptide / polynucleotide complex (especially a complex of variable region sequences, the amplification product of which is shuffled in vitro and / or in vivo in one or more additional rounds of screening). Mutagenesis PCR amplification is performed prior to sequencing. The same general approach is used with single-chain antibodies, typically by diversifying the CDRs or adjacent framework regions before or simultaneously with shuffling, to increase diversity and increase binding affinity / Specificity can be increased. If desired, the shuffling reaction may be enhanced with a mutagenic oligonucleotide capable of in vitro recombination by a selected library member. Thus, synthetic oligonucleotides and PCR-generated polynucleotides (synthesized by error-prone or high fidelity methods) can be added to the in vitro shuffling mix and incorporated into the resulting shuffled library members (Shahland). .
[0376]
Shuffling of the present invention allows for the generation of vast libraries of CDR mutant single chain antibodies. One way to generate such antibodies is to insert the synthetic CDRs into a single-chain antibody and / or CDR randomization before or simultaneously with shuffling. The sequence of the synthetic CDR cassette is selected with reference to the known sequence data of the human CDRs, and selected at the discretion of the experimenter according to the following guidelines: The synthetic CDR is at least 40 % Position sequence identity, preferably at least 50-70% position sequence identity to a known CDR sequence. For example, a population of oligonucleotide sequences can be synthesized based on the naturally occurring human CDR sequences listed in Kabat (Katat et al., 1991) to generate a population of synthetic CDR sequences. A pool of synthetic CDR sequences is calculated and encodes a CDR peptide sequence having at least 40% sequence identity to at least one known naturally occurring human CDR sequence. Alternatively, by comparing populations of naturally occurring CDR sequences to generate a consensus sequence, commonly used amino acids at residue positions (at least 5% of known CDR sequences) are incorporated into synthetic CDRs at corresponding positions. Typically, a plurality (eg, 3 to about 50) of the known CDR sequences are compared and a table is generated for the native sequence diversity found between the known CDRs. A population of oligonucleotides encoding CDR peptide sequences encompassing all or most of the perceived native sequence diversity is then synthesized. As a non-limiting example, if the population of human VH CDR sequences has a carboxy-terminal amino acid that is either Tyr, Val, Phe, or Asp, the carboxy-terminal CDR residue will be any of the above amino acids As such, a pool of synthetic CDR oligonucleotide sequences is designed. In some embodiments, residues other than those that occur naturally at residue positions in the population of CDR sequences are incorporated. Conservative amino acid substitutions are often incorporated, and up to five residue positions can be varied to incorporate non-conservative amino acid substitutions as compared to a known naturally occurring CDR sequence. Such CDR sequences can be used in the primary library member (prior to the first round of selection) and / or used to spike the in vitro shuffling reaction of the selected library member sequence. Construction of such pools of defined and / or degenerate sequences will be readily accomplished by those of skill in the art.
[0377]
The population of synthetic CDR sequences contains at least one member that is not known to be a naturally occurring CDR sequence. At the experimenter's discretion, a portion of the random or pseudo-random sequence corresponding to the addition of the N region to the heavy chain CDR may or may not be included. The N region sequence ranges from 1 nucleotide to about 4 nucleotides occurring at the VD and DJ junctions. A population of synthetic heavy chain CDR sequences comprises at least about 100 unique CDR sequences, typically at least about 1,000 unique CDR sequences, preferably at least about 10,000 unique CDR sequences, often 50,000 or more. Includes unique CDR sequences, but does not include more than 1 × 10 6 unique CDR sequences in the population. However, in some cases, particularly at positions in naturally occurring human CDRs where conservative amino acid substitutions are absent or rare (i.e., 0.1% or less), where conservative amino acid substitutions are possible, 1x107- There is a 1x108 unique CDR sequence. Generally, the number of unique CDRs contained in the library should not exceed the expected number of primary transformed cells in the library by a factor of 10 or more. Such single chain antibodies are generally at least about 1 × 10 m −, preferably at least about 5 × 107M-1, more preferably at least 1 × 108M-1 to 1x109M-1, sometimes 1x1010Binds with affinity up to M-1 or higher. In many cases, the predetermined antigen is, for example, a human cell surface antigen (eg, CD4, CD8, IL-2 receptor, EGF receptor, PDGF receptor), other human biological macromolecules (eg, thrombomodulin). , Protein C, carbohydrate antigen, sialyl Lewis antigen, L-selectin), or non-human disease-related macromolecules (eg, bacterial LPS, virion capsid protein or envelope glycoprotein).
[0378]
High affinity single chain antibodies with the desired specificity can be engineered and expressed in a variety of systems. For example, scfv has been produced in plants (Firek et al., 1993) and can be readily produced in prokaryotic systems (Qwens and Young, 1994; Johnson and Bird, 1991). In addition, single-chain antibodies can also be used as the basis for forming whole antibodies or various fragments thereof (Kettleborough et al., 1994). The variable region encoding the sequence is isolated (eg, by PCR amplification or subcloning) and the desired human constant region is encoded so as to encode a human sequence antibody which is more suitable for human therapeutic applications where immunogenicity is preferably minimized. Is spliced into the sequence encoding The resulting polynucleotide having the fully human coding sequence can be expressed in a host cell (eg, from a mammalian cell expression vector) and purified for preparation of a drug formulation.
[0379]
DNA expression constructs typically include an expression control DNA sequence operably linked to a coding sequence that includes a naturally associated or heterologous promoter region. Preferably, the expression control sequence is a eukaryotic promoter system in a vector capable of transforming or transfecting a eukaryotic host cell. After integrating the vector into a suitable host, the host is maintained under conditions suitable for high-level expression of the nucleotide sequence, and mutant "engineered" antibodies are recovered and purified.
[0380]
As already mentioned, the DNA sequence is expressed in the host after the sequence is operably linked to the expression control sequence (ie, positioned to ensure transcription and translation of the structural gene). These expression vectors are typically replicable in the host organism, either as episomes or as part of the host chromosomal DNA. In general, expression vectors allow the detection of cells transformed with the desired DNA sequence, including a selectable marker, such as tetracycline or neomycin (see, eg, US Pat. No. 4,704,362, which is hereby incorporated by reference). , Incorporated into the text as a reference).
[0381]
In addition to eukaryotic microorganisms such as yeast, mammalian tissue cell cultures can also be used to produce the polypeptides of the present invention (see Winnacker, 1987, which is incorporated herein by reference). In practice, eukaryotic cells are preferred because several suitable host cell lines have been developed which can secrete intact immunoglobulins. The eukaryotic cells include CHO cell lines, various COS cell lines, HeLa cells, and myeloma cell lines, with transformed B cells or hybridomas being preferred. Expression vectors for these cells include expression control sequences such as an origin of replication, a promoter, an enhancer and the like (Queen et al., 1986), and necessary processing information sites such as a ribosome binding site, an RNA splice site, a polyadenylation site and a transcription terminator sequence. No. Preferred expression control sequences are promoters derived from immunoglobulin genes, cytomegalovirus, SV40, adenovirus, bovine papilloma virus and the like.
[0382]
Eukaryotic DNA transcription can be increased by inserting an enhancer sequence into the vector. Enhancers are 10-300 bp cis-acting sequences that increase transcription by a promoter. The enhancer effectively increases transcription when either 51 or 31 to the transcription unit. These enhancers are also effective when located within an intron or within the coding sequence itself. Typically, viral enhancers are used, including the SV40 enhancer, the cytomegalovirus enhancer, the polyoma enhancer, and the adenovirus enhancer. Enhancer sequences derived from mammalian systems, such as mouse immunoglobulin heavy chain enhancers, are also frequently used.
[0383]
Mammalian expression vector systems also typically include a selectable marker gene. Examples of suitable labels include the dihydrofolate reductase gene (DHFR), the thymidine kinase gene (TK), or a prokaryotic gene that confers drug resistance. Preferably, the first two marker genes use a mutant cell line that is not capable of growing without the addition of thymidine to the growth medium. The transformed cells are then identified by their ability to grow on unsupplemented media. Examples of prokaryotic drug resistance genes useful as labels include the genes that confer resistance to G418, mycophenolic acid and hygromycin.
[0384]
A vector containing a target DNA segment can be transferred to a host cell by a well-known method depending on the type of a cell host. For example, calcium chloride transfection is generally used for prokaryotic cells, while other cell hosts may use calcium phosphate treatment, lipofection, or electroporation. Other methods used to transform mammalian cells include polybrene, protoplast fusion, liposomes, electroporation, and microinjection (for an overview, see Sambrook et al., 1982 and 1989).
[0385]
After expression, the individual mutated immunoglobulin chains, mutated antibody fragments, and other immunoglobulin polypeptides according to the present invention can be purified by standard methods such as ammonium sulfate precipitation, fractionation column chromatography, gel electrophoresis, etc. Can be purified according to standard procedures (for an overview, see Scopes, 1982). If desired, partially or after purification to homogeneity, the polypeptides can be used for therapy or to develop and perform assay procedures, immunofluorescent staining, etc. ( For an overview, see Lefkovits and Pernis, 1979 and 1981; Lefkovits, 1997).
[0386]
Antibodies generated by the methods of the invention can be used for diagnosis and therapy. By way of non-limiting example, these antibodies can be used to treat cancer, autoimmune diseases, or viral infections. For the treatment of cancer, the antibodies are typically expressed preferentially on cancer cells, such as erbB-2, CEA, CD33, and many other antigens and binding members well known to those of skill in the art. To join.
[0387]
End selection
The present invention is a method of selecting a subset of polynucleotides from a starting set of polynucleotides, based on the ability to identify one or more selectable features (ie, selectable markers) present anywhere in a working polynucleotide. Provides a method that allows for the acceptance (positive) and / or rejection (negative) selection of each selectable polynucleotide to be performed. In a preferred form, there is provided a method referred to as end selection, which is based on the use of a selectable marker that is partially or wholly located in the terminal region of the selectable polynucleotide. May be referred to as an “end selection marker”.
[0388]
End-selection can be performed to detect native sequences, even within the same polynucleotide, or to detect sequences introduced by experimentation (including any mutagenesis methods described or not described herein), or both. It is based on. The terminal selectable marker can be either a structural or functional selectable marker, or both a structural and functional selectable marker. The terminal selectable marker may consist of a polynucleotide or polypeptide sequence, or a chemical structure, or a biological or biochemical tag, and may detect radioactivity, enzymatic activity, fluorescence, optical characteristics, magnetic properties ( Markers (using magnetic beads), immunoreactivity, as well as markers that can be selected using methods based on detection of hybridization.
[0389]
End selection can also be used in combination with any method useful for performing mutagenesis. Such mutagenesis methods include, but are not limited to, those described herein (described above and below). Non-limiting examples of such methods include any of the methods described herein or described elsewhere, referred to by the following terms: "saturation mutagenesis", "shuffling" "," Recombination "," reassembly "," error-prone PCR "," assembly PCR "," sexual PCR "," crossover PCR "," oligonucleotide primer-specific mutagenesis ", “Periodic (and / or exponential) ensemble mutagenesis (see Arkin and Youvan, 1922),“ cassette mutagenesis ”,“ in vivo mutagenesis ”,“ in vitro mutagenesis ”. In addition, end selection includes any mutagenesis and / or amplification method (see, eg, Arnold, 1993; Cardwell and Joyce, 1992; Stemmer, 1994); selection of desirable progeny molecules, including screening for the presence of these molecules. In this case, the method can also be carried out on a molecule produced by the method preferably used))).
[0390]
In addition, end selection can be used for polynucleotides in addition to mutagenesis. In a preferred embodiment, the terminal selection described herein can be used to facilitate a cloning step, such as a step of ligation to another polynucleotide (including ligation to a vector). Thus, the present invention relates to library generation, selection and / or enhancement of desirable polynucleotides, and end selection as a useful tool to facilitate general cloning.
[0391]
In particularly preferred embodiments, end selection is based on (positive) selection of polynucleotides or (negative) selection of polynucleotides. Furthermore, end selection is based on both (positive) and (negative) selection. End selection can be performed interactively, in conjunction with other selection and / or screening methods, as well as similar or different selection and / or screening methods, and useful mutagenesis methods. All of these methods may be performed interactively and in any order, combination, and permutation.
[0392]
Also, according to some embodiments of the present invention, using end selection, at least a portion of the polynucleotide is circular (eg, a plasmid or other circular vector, or other partially circular plasmid), and / or Alternatively, polynucleotides modified or substituted with branches and / or chemical groups or moieties can be selected. According to this embodiment, the polynucleotide is a circular molecule consisting of a middle or central region. The region is 5 'to the 5' flanking region, which acts similarly to the 5 'terminal region of the acyclic polynucleotide for terminal selection, and the 3' terminal region (which is , For end-selection purposes, acts similarly to the 3'-terminal region of non-cyclic polynucleotides). As used in this non-limiting example, there may be sequence overlap between any two regions, or even between all three regions.
[0393]
In a non-limiting form of the invention, terminal selection of the linear polynucleotide comprises selecting at least one terminal located at or near the polynucleotide terminal or at multiple terminals (either 5 ′ or 3 ′ terminal). Performed using general techniques based on the presence of the marker. In one non-limiting example, end selection is based on the selection of a specific sequence at or near the end, such as, but not limited to, a sequence recognized by an enzyme that recognizes a polynucleotide sequence. Enzymes that recognize and catalyze chemical modifications of polynucleotides are referred to herein as polynucleotide acting enzymes. In a preferred embodiment, non-limiting examples of useful polynucleotide acting enzymes include enzymes having polynucleotide cleavage activity, enzymes having polynucleotide methylation activity, enzymes having polynucleotide ligation activity, and a plurality of different enzyme activities. (Including, but not limited to, those having both polynucleotide cleavage activity and polynucleotide ligation activity).
[0394]
Accordingly, relevant polynucleotide active enzymes also include commercially available or unavailable polynucleotide endonucleases, as well as their companion methylases, and can be found at the website http: // www. neb. com / rebase and those described in the references cited below (Roberts and Macelli, 1996). Preferred polynucleotide endonucleases include, but are not limited to, type II restriction enzymes (including type IIS) and enzymes that cleave both strands of a double-stranded polynucleotide (eg, 5 ′ ... GC / GGCCGC. 3 ′) and an enzyme that cleaves only one strand of a double-stranded polynucleotide, that is, an enzyme having polynucleotide-nicking activity (eg, 5 ′ ... GAGTCNNNNN / N.BstNBI) which cuts only one strand at N..3 '. In addition, applicable polynucleotide acting enzymes also include type III restriction enzymes.
[0395]
In addition, applicable polynucleotide acting enzymes include enzymes that are not currently available, but may be developed in the future, and that are useful for generating ligation compatible ends, particularly cohesive ends, in polynucleotides. It is.
[0396]
In one preferred example, a useful selectable marker is a restriction site on the polynucleotide, which causes the corresponding type II (or type IIS) restriction enzyme to cleave the end of the polynucleotide and remove the desired internal sequence within the polynucleotide. Provide a ligatable end (including a blunt end or a cohesive end having at least one base overhang) useful for the desired ligation reaction without breaking the interior of the polynucleotide without disruption. Thus, where the use of the corresponding restriction enzyme is not intended to cleave the working polynucleotide internally, among the relevant restriction sites, it will not be present internally within the particular polynucleotide to be worked on (ie, (Except at the terminal). This allows the restriction digestion reaction to be completed or nearly completed without causing unnecessary internal cleavage of the polynucleotide to be used.
[0397]
Thus, according to a preferred embodiment, it is not, or is expected to, or is not contained within the polynucleotide to be subjected to end selection (eg, sequence information about the working polynucleotide). It is preferred to use restriction sites. It should be noted that, according to this embodiment, relatively rarely present restriction sites are usually preferred over those that are often present. In contrast, internal cleavage of the polypeptide may be desired, for example, to perform recombination or other mutagenesis methods with end selection.
[0398]
According to the present invention, a method for removing unnecessary internal restriction sites (for example, a mutagenesis method) can also be used. In addition, a partial digestion reaction (ie, a digestion reaction that proceeds to partial completion) is used to achieve digestion at a recognition site in a terminal region while being generated inside the polypeptide and recognized by the same enzyme. Share sensitive restriction sites. In some forms, partial digestion is useful because certain enzymes present preferred cleavage of the same recognition sequence, depending on the location and environment in which the recognition sequence occurs. For example, although λ DNA has five EcoRI sites, it has been reported that cleavage of the site closest to the right end occurs more than 10 times faster than the site at the center of the molecule. Also, for example, Sac II has four sites in λ DNA, three of which cluster in the center and are cleaved 50 times faster than the remaining site closest to the end (at nucleotide 40,386). That is, many researchers have reported site preferences for various enzymes (eg, Thomas and Davis, 1975; Forsblum et al., 1976; Nath and Azzolina, 1981; Brown and Smith, 1977; Gingeras and Brooks, 1983). Kruger et al., 1988; Conrad and Topal, 1989; Oler et al., 1991; Topal, 1991; and Pein, 1991; just one example). Empirical observations and mechanistic knowledge, whether currently available or available in the future, depending on the polynucleotide acting enzyme used will aid in end selection according to the present invention.
[0399]
Protection methods can be used to selectively protect designated restriction sites (eg, internal sites) from unwanted digestion by enzymes, but if not, the enzymes will respond to the presence of these sites. Therefore, there is a possibility that the polynucleotide being used is cleaved. Such protection methods include modifications such as methylation or base substitution (eg, U instead of T) that inhibit unwanted enzyme activity. The number of restriction enzymes that are rare enough to generate large (eg, mega units in length) restriction fragments (eg, having very long recognition sequences) is limited, increasing the rarity of enzyme cleavage sites It should be noted that for this purpose a protective approach (eg by methylation) is useful. M. to enhance the apparent rarity of NotI. Approximately two-fold use of FnuII (mCGCG) is but one example of many (Qiang et al., 1990; Nelson et al., 1984; Maxam and Gilbert, 1980; Raleigh and Wilson, 1986).
[0400]
According to a preferred embodiment of the present invention, it is generally characterized in that the use of rare cleavage sites is preferred. In general, the frequency of occurrence of a restriction site is determined by the number of nucleotides contained therein, as well as the ambiguity of the base requirements contained therein. Thus, in a non-limiting example, a restriction site consisting of, for example, eight specific nucleotides (eg, 48A NotI site having an estimated relative incidence of 1 to 65,536, ie GC / GGCCGC, random 8-mers, is, for example, one consisting of 6 nucleotides (eg, 46SmaI sites with an estimated relative incidence of 1, or 1,096, ie, CCC / GGG, random 6-mers, and are relatively less frequent, eg, consisting of 4 nucleotides (eg, 44Relatively low frequency (MspI sites with an estimated relative incidence of 1 to 256, ie, C / CGG, random 4-mers). Furthermore, in another non-limiting example, restriction sites that generally do not have ambiguous (but very specific) base requirements (eg, 45A FinI site with an estimated relative incidence of 1 in 1024, ie, CTCCC, random 5-mers, has a polysemy W (where W = A or T) base requirement (eg, 1 in 4 × 4 × 2 × 4 × 4). Ie, relatively less frequent than the AvaII site with an estimated relative incidence of 1 in 512 or G / GWCC-random 5-mers, but with ambiguity N (where N = A or C or G or T) bases It is relatively less frequent than those that have a requirement (eg, an Asul site with an estimated relative incidence of 1 in 4x4x1x4x4, or 1 in 256, ie, G / GNCC-random 5-mers). These relative rates indicate that specific nucleotide bases (not to mention specific nucleotide sequences) occur at different frequencies in specific polynucleotides, specific species of organisms, and specific groups of organisms. As a result, it is considered to be a rough estimate of the actual polynucleotide. For example, the% G + C content of different species of organisms is often very different and varies over a wide range.
[0401]
Relatively rare restriction sites used as selection labels include, but are not limited to, preferably at least four nucleotide sequences, more preferably at least five nucleotide sequences, more preferably at least six nucleotide sequences. (Eg, a BamHI site or G / GATCC, a BglII site or A / GATCT, a PstI site or CTGCA / G, and an XbaI site or T / CTAGA), more preferably one consisting of at least 7 nucleotide sequences, more preferably Consists of at least 8 nucleotide sequences (eg, AscI site or GG / CGCGCC, NotI site or GC / GGCCGC, PacI site or TTAAT / TAA, PmeI site or TTT / AAAC, SrfI site or GCCC / GGGC, Sse838I site or CCTGCA / GG, and SwaI site or ATTT / AAAT), more preferably those consisting of 9 nucleotide sequences, more preferably those consisting of at least 10 nucleotide sequences ( For example, a BspGI site (CG / CGCTGGAC) is included. In addition, some restriction sites (eg, class IIS enzymes) have portions with relatively high specificity (ie, those that contain major determinants of the occurrence of restriction sites) and portions with relatively low specificity. And the cleavage site may or may not be included in the portion having relatively low specificity. For example, the Eco57I site or CTGAAG (16/14) has a relatively specific portion (ie, the CTGAAG portion) and a relatively low specificity portion containing the cleavage site (ie, the N16 sequence).
[0402]
In another preferred aspect of the invention, useful end-selective labels are end sequences recognized by a polynucleotide-acting enzyme that recognizes a specific polynucleotide sequence. In a preferred form of the invention, useful end-selective labels include other enzymes in addition to conventional type II restriction enzymes. According to this preferred form of the invention, useful polynucleotide acting enzymes include gyrase, helicase, recombinase, relaxase, and related enzymes.
[0403]
Preferred examples include, among others, topoisomerases (partially categorized as a subset of gyrase), and other having polynucleotide cleavage activity (preferably, including polynucleotide nicking activity) and / or polynucleotide ligation activity All enzymes. Preferred topoisomerase enzymes are especially available from commercial sources (Epicentre Technologies, Madison, WI; Invitrogen, Carlsbad, CA; Life Technologies, Gathesberg, MD) and possibly also from private sources. And topoisomerase I enzymes. It is contemplated that similar enzymes useful for end selection as described herein will be developed in the future. A particularly preferred topoisomerase I enzyme is a vaccinia virus-originated topoisomerase I enzyme, which has a specific recognition sequence (eg, 5 '... AAGGG ... 3') and has a polynucleotide nicking activity. And polynucleotide ligation activity. Due to the specific nicking activity (cleavage of one strand) of this enzyme, the internal recognition site is less susceptible to polynucleotide disruption caused by nicking activity at temperatures that cause denaturation of the cleaved end site (rather, the annealed condition). Keep). Therefore, when used for truncation, the nicking site for terminal selection based on topoisomerase is 100 nucleotides or less from the terminal, more preferably 50 nucleotides or less from the terminal, more preferably 25 nucleotides or less from the terminal, more preferably 25 nucleotides or less from the terminal. , 20 nucleotides or less from the terminal, more preferably 15 nucleotides or less from the terminal, more preferably 10 nucleotides or less from the terminal, more preferably 8 nucleotides or less from the terminal, more preferably 6 nucleotides or less from the terminal, more preferably , Preferably 4 nucleotides or less from the end.
[0404]
In a non-limiting, particularly preferred embodiment for illustrative purposes only, when the nicking site for end selection based on topoisomerase is 4 nucleotides from the end, nicking produces a single-stranded oligo of 4 bases (in the terminal region) However, the oligo can be denatured from its complementary strand in an end-selectable polynucleotide. This forms cohesive ends (consisting of 4 bases) of the polynucleotide that are useful for subsequent ligation reactions. To achieve a ligation reaction with a cloning vector (preferably an expression vector), compatible sticky ends can be generated in the cloning vector by any means, such as those based on restriction enzymes. By judiciously selecting the terminal nucleotide (in this example, consisting of the four terminal bases) at the terminal selectable polynucleotide terminus, compatibility is imparted to the cohesive ends generated in the cloning vector to which the polynucleotide is to be ligated. can do.
[0405]
In contrast, internal nicking of an end-selectable polynucleotide, for example, 500 bases from the end, produces a single-stranded oligo of 500 bases, which is not easily denatured from its complementary strand, but is rather repairable. Useful (eg, the same topoisomerase enzyme that generates nicks).
[0406]
Accordingly, the present invention is directed to generating a polynucleotide nicking cohesive end for practicing-for example based on vaccinia topoisomerase and / or based on type II (or IIS) restriction endonuclease and / or type III restriction endonuclease And / or based on a nicking enzyme (e.g., using N.BstNBI), wherein the ends are ligation compatible and comprise at least one base overhang. Preferably, such cohesive ends consist of at least 2 base overhangs, more preferably the cohesive ends consist of at least 3 base overhangs, more preferably the sticky ends consist of at least 4 base overhangs. And more preferably, the cohesive end comprises at least a 5 base overhang, and more preferably the cohesive end comprises at least a 6 base overhang. In addition, the cohesive end is at least 7 base overhang, or at least 8 base overhang, or at least 9 base overhang, or at least 10 base overhang, or at least 15 base overhang, or at least 20 base overhang. It may consist of an overhang, or an overhang of at least 25 bases, or an overhang of at least 30 bases. These overhangs may be composed of any base, including A, C, G or T.
[0407]
Cohesive end overhangs introduced using topoisomerases or nicking enzymes (eg, using N.BstNBI) can be uniquely designed for the ligation environment, including self-dimerization and other unwanted linearization. Unnecessary fragment reassembly can be prevented.
[0408]
According to one aspect of the invention, the use of a polymerase-based reaction introduces a plurality of sequences (which may, but need not necessarily, overlap) in the terminal region of the end-selectable polynucleotide. be able to. In applicable, but not limiting examples, such oligos can be used to achieve a preferred 5'-terminal region useful for topoisomerase I-based end selection. The oligo has a 1-10 base sequence convertible (preferably by vaccinia topoisomerase I) to a cohesive end, a ribosome binding site (ie, "RBS", preferably useful for expression cloning), and optionally Followed by an ATG start site and a 0-100 base template-specific sequence (to facilitate annealing to the template in a polymerase-based reaction). Thus, according to this aspect, a useful oligo (called forward primer) has the following sequence: 5 '[terminal sequence = (N)1-10] [Topoisomerase I site and RBS = AAGGGAGGAG] [Linker = (N)1-100[Starting codon and template specific sequence = ATG (N)0-1003 '.
[0409]
Similarly, in applicable but not limiting examples, oligos can be used to achieve a preferred 3 'terminal region useful for topoisomerase I-based end selection. This oligo has a 1-10 base sequence (preferably by vaccinia topoisomerase I) convertible to a sticky end, and an optional linker sequence followed by a 0-100 base template-specific sequence (polymerase-based reaction). To facilitate annealing to the mold at Thus, according to this embodiment, a useful oligo (called a reverse primer) has the following sequence: 5 '[terminal sequence = (N)1-10] [Topoisomerase I site = AAGGG] [Linker = (N)1-100] [Template-specific sequence = ATG (N)0-1003 '.
[0410]
End selection can be used to identify and separate a parent template molecule (eg, one for which mutagenesis is to be performed) from progeny molecules (eg, those generated by mutagenesis). For example, a first set of primers lacking a topoisomerase I recognition site can be used to modify the terminal region of the parent molecule (eg, polymerase based amplification). A mutated progeny molecule can then be generated from the amplified template molecule using a second set of alternative primers (eg, having a topoisomerase I recognition site) (eg, interrupting synthesis). A polynucleotide chimerization method, such as amplification based on template switching polymerase, or interruption of synthesis; or saturation mutagenesis; or, as described herein, a topoisomerase I-recognition molecule can be converted to a mutagenized progeny molecule. Using any other method to introduce). In turn, topoisomerase I-based end selection can be used to facilitate selective topoisomerase I-based ligation of the desired progeny molecule as well as discrimination.
[0411]
Thus, annealing of the second set of primers to the amplified parent molecule is similar to the first set of primers (ie, the primers used to amplify the set of parent sites) to the topoisomerase I recognition site. Can be facilitated by incorporating sequences that are sufficiently different to inhibit recognition of a functional topoisomerase I enzyme. For example, sequences varying from one base to all five bases of any of the AAGGG sites can be incorporated into a first set of primers (used for amplification of the parent template prior to mutagenesis). In a specific and non-limiting form, the parent molecule can be amplified using a non-limiting set of forward and reverse primers as shown below by way of example.
[0412]
Forward primer: 5 'CTAGAAGAGAGGAGAAAACCCATG (N)10-1003 ', and
Reverse primer: 5'GATCAAAGGCCGGCCTGCAGGG (N)10-1003 '
According to the above example of the first set of primers, (N)10-100Is preferably a template-specific sequence of 10 to 100 nucleotides in length, more preferably a template-specific sequence of 10 to 50 nucleotides in length, more preferably a template-specific sequence of 10 to 30 nucleotides in length, more preferably Indicates a template-specific sequence of 15 to 25 nucleotides in length.
[0413]
According to a specific and non-limiting embodiment, after this amplification (using the first set of primers lacking a true topoisomerase I recognition site), the amplified parent molecule is transformed with the true topoisomerase I recognition site. Mutagenesis is characterized by using one or more sets of forward and reverse primers. Thus, in a specific, non-limiting form, the parent molecule is used to generate a mutagenized progeny molecule using a second set of forward and reverse primers, shown below by way of example and by no means limiting. It is characterized by being used as a template.
[0414]
Forward primer: 5'CTAGAAGGGAGGAGAAAACCCATG3 '
Reverse primer: 5'GATCAAAGGCGCGCCTGCAGGG3 '(including AscI recognition site sequence)
As the first, second or subsequent set of primers for end selection according to the present invention, any number of different primers not specifically described can be used. It should be noted that a type II restriction enzyme site may be incorporated (eg, AscI site in the example above). Also, in order to subject the working polynucleotide to saturation mutagenesis, the experimenter can incorporate one or more N, N, G / T triplets, in addition to the other sequences described, into useful primers. That is, the use of the second and / or subsequent sets of primers can achieve the two objectives of introducing a topoisomerase I site and inducing mutations in progeny polynucleotides.
[0415]
Thus, according to one aspect provided, a useful end-selection label is an enzyme recognition site, which causes the enzyme to cleave (including nick) the polynucleotide at the designated site and generate the single-stranded product. At the same time as the strand oligo denatures, it forms a ligation compatible end. The ligation reaction of the formed polynucleotide ends can then be accomplished using the same enzyme (eg, topoisomerase I in the case of vaccinia virus), or another enzyme. According to one aspect of the invention, polynucleotides may be selected to be homologous (eg, two vaccinia virus topoisomerase I recognition sites) or heterologous (eg, a class II restriction enzyme recognition site and a vaccinia virus topoisomerase I recognition site). Alternatively, any combination of end-selective labels can be used. Accordingly, each selectable polynucleotide has one or more end-selective labels, which can be either homologous or heterologous end-selective labels. In a specific example, a plurality of end-selective labels can be located at one end of the polynucleotide so that they have overlapping sequences with each other.
[0416]
It should be particularly noted that any type of enzyme, whether present or future developed, will be useful in end selection according to the present invention. For example, in a specific embodiment of the invention, to achieve end selection, a nicking enzyme (eg, 5 '... GAGTCNNNNN / N ... 3', with only one strand combined with a source of polynucleotide ligation activity). N.BstNBI to cut) can be used. According to this aspect, N.I. A recognition site for BstNBI (rather than a recognition site for topoisomerase I) must be incorporated into an end-selectable polynucleotide (whether end-selection is used to select for mutagenized progeny molecules, or mutagenesis procedures). Independently of using end selection).
[0417]
This end selection approach using topoisomerase-based nicking and ligation has several advantages over traditional selection methods. That is, this approach allows directional cloning (including expression cloning) to be achieved. In particular, this technique can be used to achieve the following: direct ligation (ie, no need to be subjected to traditional restriction-purification-ligation reactions; this requires the use of T4 DNA ligase from initiation restriction reactions). From the original template molecule (eg, the original template molecule lacking the topoisomerase I site, which is not introduced until after mutagenesis). Separation of molecules; no need for size separation steps (eg, by gel chromatography or other electrophoresis means or use of size exclusion membranes); conservation of internal sequences (even in the presence of topoisomerase I); ligation reaction (Eg, relying on the use of T4 DNA ligase, especially in the presence of unwanted residual restriction enzyme activity), To become; and the promotion of expression cloning (such as fear of frameshift is eliminated). Also, with the above-described end-selection method using topoisomerase-based nicking and ligation, concerns about unnecessary restriction enzyme-based cleavage-especially at internal restriction sites of the polynucleotide to be performed (or Even at unpredictable sites)-can be eliminated. This cleavage may be a disruption site for the working polynucleotide.
[0418]
2-Hybrid based screening assay
The pool of selected library members obtained by screening the two-hybrid screening system using shuffling is diversified by recombination to identify library members that bind to a predetermined polypeptide sequence. be able to. The selected library members are pooled and shuffled by in vitro and / or in vivo recombination. The shuffled pool is then screened in a yeast two-hybrid system to determine the predetermined polypeptide sequence (e.g., SH2 domain) or an alternative predetermined polypeptide sequence (e.g., another (SH2 domains from protein species) can be selected.
[0419]
A technique for identifying polypeptide sequences that bind to a predetermined polypeptide sequence has been to use a so-called "2-hybrid" system in which the predetermined polypeptide sequence is present in a fusion protein (Chien et al., 1991). This approach identifies protein-protein interactions in vivo through the transcriptional activators (Fields and Song et al., 1989), a reconstitution of the yeast Ga14 transcribed protein. This method is typically based on the properties of the yeast Ga14 protein. The protein consists of separable domains responsible for DNA binding and transcriptional activation. Poly-encoding two hybrid proteins, one consisting of a yeast Ga14 DNA binding domain fused to the polypeptide sequence of a known protein and the other consisting of a Ga14 activation domain fused to the polypeptide sequence of a second protein A nucleotide is made and introduced into a yeast host cell. The intermolecular binding of the two fusion proteins reconstitutes the Ga14 binding domain with the Ga14 activation domain, thereby resulting in the transcriptional activity of a reporter gene (eg, lacz, HIS3) operably linked to the Ga14 DNA binding site. Transformation occurs. Typically, two-hybrid methods are used to identify novel polypeptide sequences that interact with known proteins (Silver and Hunt, 1993; Durfey et al., 1993; Yang et al., 1992; Luban et al., 1993; Hardy Bartel et al., 1993; and Vojtek et al., 1993). However, variants of the two-hybrid method have been used to identify mutations in known proteins that affect binding to a second known protein (Li and Fields, 1993; Lalo et al., 1993; Jackson et al., 1993; and Madura et al., 1993). Also, the two-hybrid system identifies the interacting structural domains of two known proteins (Bardwell et al., 1993; Chakrabarty et al., 1992: Staudinger et al., 1993; and Milne and Weaver 1993); or oligomerization of a single protein (Iwabuchi et al., 1993; Bogerd et al., 1993). A variant of the two-hybrid system has been used to study the in vivo activity of proteolytic enzymes (Dasmahapatra et al., 1992). Alternatively, the interacting protein sequence (ie, heterodimerizing or higher heterogeneous, or heterodimerization) may be performed using an E. coli / BCCP interaction screening system (Germino et al., 1992; Guarente, 1993). Protein sequences that form the body) can also be identified. After the sequences selected by the two-hybrid system are pooled and shuffled, they are introduced into the two-hybrid system and subjected to one or more rounds of further screening to identify polypeptide hybrids that bind to the hybrid containing the predetermined binding sequence. It is also possible to identify. The sequences thus identified are compared to identify the consensus sequence and the kernal of the consensus sequence.
[0420]
In general, standard methods of recombinant DNA technology are described in various publications (eg, Sambrook et al., 1989; Ausubel et al., 1987; and Berger and Kimmel, 1987; both incorporated herein by reference in their entirety). . Enzymes that modify the polynucleotide were used according to the manufacturer's recommendations. Applied Biosystems Inc. using ABI chemicals. Oligonucleotides were synthesized using a Model 394 DNA synthesizer. If desired, a PCR amplifier may be selected at the discretion of the experimenter to amplify a predetermined DNA sequence.
[0421]
A sample of 1 microgram of template DNA is collected and treated with UV light to produce a TT dimer, particularly a purine dimer. UV exposure limits the generation of few photoproducts for each gene in the template DNA sample. At different times, the multiple samples are treated with UV light to produce a template DNA sample having a variable number of dimers from UV exposure.
[0422]
Using a random priming kit using a non-proofreading polymerase (e.g., Prime-ItII random primer labeling kit from Stratagene Cloning Systems), priming at a random site of a template (as described above) made with UV light, Extending along produces polynucleotides of various sizes. Primers may be extended using a priming protocol such as the Prime-ItII random primer labeling kit as described above. The dimer made by UV exposure serves as a roadblock for extension by an uncalibrated polymerase. Thus, upon completion of the extension with the random primer, a pool of polynucleotides of random size is present.
[0423]
The invention further produces a selected mutant polynucleotide sequence (or a population of selected polynucleotide sequences), typically in the form of an amplified and / or cloned polynucleotide, That the selected polynucleotide sequence has at least one desired phenotypic characteristic from which it can be selected (eg, encodes a polypeptide, facilitates transcription of a bound polynucleotide, binds a protein, etc.). The method is characterized. One method of identifying a hybrid polypeptide having a desired structure or functional property, such as binding to a predetermined biological macromolecule (eg, a receptor), is to use a desired structure provided by the amino acid sequence of the polypeptide. Or screening large libraries of polypeptides for individual library members having functional properties.
[0424]
In one aspect, the invention provides a method of generating a library of displayed polypeptides or displayed antibodies suitable for affinity interaction screening or phenotypic screening. The method comprises the steps of: (1) creating a first population of selected library members comprising a display polypeptide or display antibody and an associated polynucleotide encoding the display polypeptide or display antibody, wherein the associated polynucleotide is Making said associated polynucleotide or a copy thereof comprising a region of substantially the same sequence, optimally introducing mutations in said polynucleotide or copy, (2) {pooling the polynucleotide or copy, (3)} random or specialized By interrupting the priming and synthesis or amplification method, a smaller or shorter polynucleotide is produced, and (4) newly synthesized by performing amplification, preferably PCR amplification, and optionally mutagenesis. Homologous recombination of selected polynucleotides? Made.
[0425]
A particularly preferred object of the present invention is to provide a method for producing a hybrid polynucleotide expressing a useful hybrid polypeptide by a series of steps including:
(A) generating polynucleotides by interrupting the polynucleotide amplification or synthesis process by means of stopping or interrupting the amplification or synthesis so that the replication of the polynucleotide is at various stages of completion; Producing a plurality of small or short polynucleotides;
(B) {circle around (1)} adding one or more single-stranded or double-stranded oligonucleotides to the obtained population of single-stranded or double-stranded polynucleotides; The heterologous region for one or more single-stranded or double-stranded polynucleotides comprises the same region;
(C) 変 性 denaturing the resulting single-stranded or double-stranded oligonucleotides to produce a mixture of single-stranded polynucleotides, optionally converting small or short polynucleotides to polynucleotides of various lengths And optionally subjecting the polynucleotide to a PCR step to amplify one or more oligonucleotides contained in at least one of said polynucleotide pools;
(D) {incubation of a plurality of the polynucleotides or at least one pool of the polynucleotides with a polymerase, wherein the conditions are such that the same region of the single-stranded polynucleotides Annealing occurs such that a mutagenized double stranded polynucleotide chain is formed;
(E) 繰 り 返 し optionally repeating steps (c) and (d) above;
(F) expressing at least one hybrid polypeptide from the polynucleotide chain;
(G) screening at least one hybrid polypeptide for useful activity.
[0426]
In a preferred embodiment of the invention, the means for stopping or interrupting the amplification or synthesis step is by the use of UV light, DNA adducts, DNA binding proteins.
[0427]
In one embodiment of the present invention, the DNA adduct, or the polynucleotide comprising the DNA adduct, may be treated with the polynucleotide or polynucleotide by a method comprising heating a solution containing the DNA fragment before further processing. Remove from pool.
[0428]
While exemplary embodiments of the present invention have been disclosed above, it should be noted that these embodiments are for illustration only, and that other alternatives, adjustments and modifications may be made within the scope of the present invention. Accordingly, the present invention is not limited to the specific embodiments shown herein.
[0429]
Without further elaboration, it is believed that one skilled in the art can, using the preceding description, utilize the present invention to its fullest extent. The examples described below are to be considered as illustrative and do not limit the disclosure other than these.
[0430]
Example 1
Generation of random-sized polynucleotides using UV-induced photochemical products
One microgram of the template DNA sample is collected and treated with UV light to form a TT dimer, especially a dimer such as a purine dimer. UV exposure limits the number of photochemical products generated for each gene in the template DNA sample to be very small. Multiple samples are treated with UV for varying times to obtain a template DNA sample with a variable number of dimers from UV exposure.
[0431]
Using a random priming kit with a non-proofreading polymerase (e.g., Prime-ItII random primer labeling kit from Stratagene Cloning Systems), priming at a random site of a UV-produced template (as described above) and along the template To produce polynucleotides of various sizes. Primers may be extended using a priming protocol such as the Prime-ItII random primer labeling kit as described above. Dimers made by UV exposure serve as a roadblock for extension by unproofreading polymerases. Therefore, when the extension with the random primer is completed, a pool of polynucleotides of random size is present.
[0432]
Example 2
Isolation of random size polynucleotides
The target polynucleotide prepared in Example 1 is gel-isolated on a 1.5% agarose gel. Polynucleotides in the 100-300 bp range are cut out of the gel and 3 volumes of 6M NaI are added to the gel slice. The mixture is incubated for 10 minutes at 50 ° C. and 10 μl of glass milk (Bio 101) is added. Spin the mixture for 1 minute and decant the supernatant. The pellet is washed with 500 μl of column wash (column wash is 50% ethanol, 10 mM Tris-HCl pH 7.5, 100 mM NaCl and 2.5 mM EDTA), rotated for 1 minute, and the supernatant is decanted. Next, washing, rotation and tilting are repeated. Glass milk pellets are mixed with 20 μl of H2Resuspend in O and spin for 1 minute. DNA is maintained in the aqueous phase.
[0433]
Example 3
Random size isolated 100 ~ 300bp Polynucleotide shuffling
The 100-300 bp polynucleotide prepared in Example 2 was added to the annealing mixture (0.2 mM each dNTP, 2.2 mM MgCl 2) without adding a primer.2, 50 mM KCl, 10 mM Tris-HCl pH 8.8, 0.1% Triton X-100, 0.3 μm; Taq DNA polymerase, 50 μl in total volume). The annealing step was performed using the Robocycler from Stratagene with the following procedure: 95 ° C. for 30 seconds, 25-50 cycles [95 ° C. for 30 seconds, 50-60 ° C. for 30 seconds (preferably 58 ° C.), and 30 seconds. 72 ° C], as well as 72 ° C for 5 minutes. In this way, a 100-300 bp polynucleotide was bound, and a double-stranded polynucleotide having a longer sequence was obtained. Separating the reassembled double-stranded polynucleotides, denaturing them to form single-stranded polynucleotides, and optionally adding the single-stranded template and primer samples, The cycle is repeated with another sample using random primer DNA.
[0434]
Example 4
Screening shuffled polynucleotides
The polynucleotide of Example 3 is separated and the polypeptide is expressed therefrom. The original template DNA is used as a control by making a comparative polypeptide therefrom. The polypeptide obtained from the shuffled polypeptide of Example 3 is screened for the activity of the polypeptide obtained from the original template and compared to the activity level of a control. Shuffled polynucleotides encoding the polypeptide of interest discovered during the screen are compared for desirable secondary properties. A shuffled polynucleotide corresponding to a screened polypeptide different from the one of interest is reshuffled.
[0435]
Example 5
Directed evolution of enzymes by saturation mutagenesis
Site saturation mutagenesis:To achieve site saturation mutation, each residue (316) of the dehalogenase enzyme was converted to a total of 20 amino acids by site-directed mutagenesis using 32-fold degenerate oligonucleotide primers as described below. .
[0436]
1. A culture of the dehalogenase expression construct was cultured to prepare a plasmid.
[0437]
2. Primers for randomizing each codon were prepared. These have a common structure: X20NN (G / T) X20Having.
[0438]
3. A 25 μl reaction mixture was prepared containing approximately 50 ng of plasmid template, 125 ng of each primer, 1 × native Pfu buffer, 200 μM of each dNTP, and 2.5 U native Pfu DNA polymerase.
[0439]
4. The following cycle reactions were performed on a Robo96 Gradient Cycler:
Initial denaturation at 95 ° C for 1 minute,
20 cycles of 95 ° C for 45 seconds, 53 ° C for 1 minute, 72 ° C for 11 minutes
Final extension step at 72 ° C. for 10 minutes.
[0440]
The reaction mixture was digested with 5.10 U of DpnI at 37 ° C. for 1 hour to digest the methylated template DNA.
[0441]
Using 6.2 ul of the reaction mixture, 50 ul of XL1-Blue MRF 'cells were transformed and the whole transformation mix was plated on large LB-Amp-Met plates to obtain 200-1000 colonies.
[0442]
7. Individual colonies were transferred to the wells of a 96-well microplate containing LB-Amp-IPTG with a maggot and grown overnight.
[0443]
8. Clones on these plates were assayed the next day.
[0444]
screening:Approximately 200 clones of the mutant for each position were grown in liquid media (384-well microplates) and screened as described below.
[0445]
Cultures left overnight in 1.384-well plates were centrifuged to remove media. Each well contains 0.06 mL 1 mM Tris / SO4 2- pH 7.8 was added.
[0446]
Two assay plates were made from each parent culture plate consisting of a 2.0.02 mL cell suspension.
[0447]
3. For a given period of time (first 30 minutes), one assay plate was placed at room temperature and the other at elevated temperature (55 ° C. for initial screening).
[0448]
4. After the specified time, 0.08 mL room temperature substrate (1.5 mM NaN3Saturated 1 mM Tris / SO containing 0.1 mM and 0.1 mM bromothymol blue4 2- pH 7.8) was added to each well.
[0449]
5. At each time point, a measurement at 620 nm was performed and a progress curve was generated for each well.
[0450]
6. The data was analyzed and the kinetics of the unheated and heated cells were compared. Each plate contained 1-2 columns (24 wells) of unmutated 20F12 control.
[0451]
7. Wells that appeared to have improved stability were re-cultured and then tested under the same conditions.
[0452]
According to this procedure, nine single-site mutations were found to confer increased thermostability to the enzyme. Sequence analysis was performed to determine the exact amino acid changes at each position that specifically caused the improvement. That is, the improvement was conferred by only one amino acid change at seven sites, by each of two amino acid changes at position 8, and at each of three amino acid changes at position 9. Next, several mutants were created, each combining several of these nine advantageous site abrupt changes. Two of them were found to be superior to all other mutants, including single point mutations.
[0453]
Example 6
Direct expression using end selection
The esterase gene was amplified in a standard PCR reaction using 5 ′ phosphorylated primers (10 ng template; PCR conditions: 94 ° C. for 3 minutes; [94 ° C. for 1 minute; 50 ° C. for 1 minute; 68 ° C. for 1 minute 30 seconds 68 ° C.) × 30; 10 minutes at 68 ° C).
[0454]
Forward primer = 9511TopF
(CTAGAAGGGAGGAGAATTACATGAAGCGCTTTTAGCCC)
Reverse primer = 9511TopR (AGCTAAGGGTCAAGGCCGACCCCGAGG)
The resulting PCR product (about 1000 bp) was gel purified and quantified.
[0455]
The vector for expression cloning, pASK3 (Institute for Bioanalytik, Goettingen, Germany), was cut with Xba I and Bgl II and dephosphorylated with CIP.
[0456]
0.5 pmole of Vaccina Topoisomerase I (Invitrogen, Carlsbad, Calif.) Was purified to a total of 5 μl of buffer NEBI (New England Biolabs, Beverly, Mass.) For 5 minutes at 37 ° C., 60 ng (about 0.1 pmole) purified PCR product. Was added.
[0457]
The topogated PCR product was cloned into the vector pASK3 (5 μl in NEBI, about 200 ng) for 5 minutes at room temperature.
[0458]
Mixture with H2It was dialyzed against O for 30 minutes.
[0459]
Electroporation of DH10B cells was performed with 2 μl (Gibco BRL, Geithersburg, MD).
[0460]
Efficiency: According to the actual number of clones, this method requires 2 × 106Clones can be produced. All recombinants tested showed esterase activity after induction by anhydrotetracycline.
[0461]
Example 7
Dehalogenase thermostability
The present invention is directed to a method wherein the desired properties produced by directed evolution are subjected to an altered environment, such as one considered to be a harsh environment, for a specified period of time, followed by improved residual activity of the molecule (eg, enzyme activity, Reactivity, antibiotic activity, etc.). Such harsh environments can include any combination of the following (repeated or non-repeated, in any order or permutation): Elevated temperature, including temperatures that can cause denaturation of the working enzyme ), Decreased temperature, increased salt concentration, decreased salt concentration, increased pH, decreased pH, increased pressure, decreased pressure, and changes in radiation source exposure (including ultraviolet, visible, and full electromagnetic spectra).
[0462]
The following examples illustrate the use of directed evolution to evolve the ability of enzymes to restore and / or retain activity after exposure to elevated temperatures.
[0463]
Each residue (316) of the dehalogenase enzyme was converted to a total of 20 amino acids by site-directed mutagenesis using 32-fold degenerate oligonucleotide primers. These mutations were introduced into the already improved mutant Dhla20F12. About 200 clones at each position were cultured in liquid medium (384-well microplate) and screened.
[0464]
The screening procedure is as follows:
Cultures left overnight in 1.384-well plates were centrifuged to remove media. Each well contains 0.06 mL 1 mM Tris / SO4 2- pH 7.8 was added.
[0465]
Two assay plates were robotically made from each parent culture plate consisting of a 2.0.02 mL cell suspension.
[0466]
3. For a given period of time (first 30 minutes), one assay plate was placed at room temperature and the other at elevated temperature (55 ° C. for initial screening).
[0467]
4. After the specified time, 0.08 mL room temperature substrate (1.5 mM NaN3Saturated 1 mM Tris / SO containing 0.1 mM and 0.1 mM bromothymol blue4 2- pH 7.8) was added to each well. TCP = trichloropropane.
[0468]
5. At each time point, a measurement at 620 nm was performed and a progress curve was generated for each well.
[0469]
6. The data was analyzed and the kinetics of the unheated and heated cells were compared. Each plate contained 1-2 columns (24 wells) of unmutated 20F12 control.
[0470]
7. Wells that appeared to have improved stability were re-cultured and then tested under the same conditions.
[0471]
According to this procedure, nine single-site mutations were found to confer increased thermostability on Dhla-20F12. Sequence analysis revealed that the following changes were advantageous.
[0472]
D89G
F91S
T159L
G189Q, G189V
I220L
N238T
W251Y
P302A, P302L, P302S, P302K
P302R / S306R
Only two sites (189 and 302) had one or more substitutions. The first five from the above list were integrated (using G189Q) into a single gene (this mutant is called "Dhla5"). All changes except S306R have been incorporated into another mutant called Dhla8.
[0473]
Thermal stability was assessed by incubating the enzyme at elevated temperatures (55 ° C. and 80 ° C.) for a predetermined period of time, and activity assays were performed at 30 ° C. At the higher temperature, the initial speed was recorded hourly. The enzyme was used for both incubation and assay, with 50 mM Tris / SO4 2- It was contained at pH 7.8. Fe (NO3)3Product (Cl 2) by standard methods using HgSCN and) Was detected. Dhla20F12 was used as a de facto wild type. By fitting the data to an exponential decay function, the apparent half-life (T1/2) Was calculated.
[0474]
These results are shown in FIG.
[0475]
References
Unless otherwise indicated, all references mentioned above (above and below) are hereby incorporated by reference in their entirety.
[0476]
Barret AJ et al.Enzyme Nomenclature: Recommendations of the Nomenclature Committee of the International Union of Biochemistry and Molecular Biology. ("Enzyme nomenclature: recommendations of the International Union of Biochemical and Molecular Biology Nomenclature Committee"), San Diego: Academic Press, Inc. , 1992.
Boyce COL (ed.)Novo ' s Handbook of Practical Biotechnology. ("Novo Handbook on Practical Biotechnology"), 2nd edition, Bagsvaerd, Denmark, 1986.
Drauz K, Waldman H (ed.)Enzyme Catalysis in Organic Synthesis: A Comprehensive Handbook. ("Enzyme Catalysts in Organic Synthesis: A Comprehensive HandbookVol. 1, New York: VCH Publishers, 1995.
Drauz K, Waldman H (ed.)Enzyme Catalysis in Organic Synthesis: A Comprehensive Handbook. ("Enzyme Catalysts in Organic Synthesis: A Comprehensive HandbookVol. 2, New York: VCH Publishers, 1995.
Foster GD, Taylor SC (ed.),Plant Virology Protocols: From Virus Isolation to Transgenic Resistance. ("Plant Virology Protocol: From Virus Isolation to Transgenic Resistance"), Methods in Molecular Biology, Vol. 81, New Jersey: Humana Press Inc. , 1998.
Franks F (ed.)Protein Biotechnology: Isolation, Characterization, and Stabilization. ("Protein Biotechnology: Isolation, Characterization, and Stabilization"), New Jersey: Humana Press Inc. , 1993.
Godfrey T, West S (ed.)Industrial Enzymology. ("Industrial enzymology)), 2nd edition, London: Macmillan Press Ltd, 1996.
Gottschalk G,Bacterial Metabolism. ("Bacterial metabolism)), 2nd edition, New York: Springer-Verlag Inc. , 1986.
Gresshoff PM (ed.),Technology Transfer of Plant Biotechnology. ("Introduction of plant biotechnology)), Current Topics in Plant Molecular Biology.
Boca Raton: CRC Press, 1997.
Griffin HG, Griffin AM (ed.),PCR Technology: Current Innovations. ("PCR Technology: Latest ideas"), Boca Raton: CRC Press, Inc. , 1994.
Hansen G, Chilton MD, "Issues in Gene Transfer to Plants by a Given Microorganism", Curr Top Microbiol Immunol 240: 21-57, 1999.
Hartmann HT (ed.),Plant Propagation: Principles and Practices. ("Plant breeding: principles and practices)), Sixth Edition, New Jersey: Prentice Hall, Inc. , 1997.
Perun TJ, Propst CL (ed.),Computer-Aided Drug Design: Methods and Applications. ("Computer-Aided Drug Design: Methods and Applications"), New York: Marcel Dekker, Inc. , 1989.
Owen MRL, Pen J,Transgenic Plants: A Production System for Industrial and Pharmaceutical Proteins. ("Transgenic plants: production systems for industrial and pharmaceutical proteinsChichester: John Wiley & Sons, 1996.
Segel IH,Enzyme Kinetics: Behavior and Analysis of Rapid Equilibrium and Steady-State Enzyme Systems. ("Enzyme kinetics: rapid equilibrium and steady-state behavior and analysis of enzyme systems"), New York: John Wiley & Sons, Inc. , 1993.
White JS, White DC,Source Book of Enzymes. ("Enzyme sourceBoca Raton: CRC Press, 1997.
Wong CH, Whitesides GM,Enzymes in Synthetic Organic Chemistry. ("Enzymes in synthetic organic chemistryVol. 12, New York: Elsevier Science Publications, 1995.
WO 97/35966, filed March 20, 1997, published October 2, 1997, Minshul J, Stemmer WP, "Methods and compositions for cell and metabolic engineering".
WO 98/31837, filed Jan. 16, 1998, published Jul. 23, 1998, Delcardayre SB, Tobin MB, Stemmer WP, Minshul, J, "Evolution of Whole Cells and Organisms by Inductive Sequence Recombination"
WO 98/37223, filed Feb. 18, 1998, published Aug. 27, 1998, Pang SZ, Gonzalves D, Jan FJ, "DNA constructs for imparting multiple traits to plants"
Alting-Mecs MA and Short JM, "Polycos Vector: Packaging System of Filamentous Phage and Phagemid Vector Using Lambda Phage Packaging Extract", Gene @ 137: 1, 93-100, 1993.
Arkin AP and Youvan DC, "Algorithms for Protein Engineering: Simulation of Inductive Ensemble Mutagenesis", Proc Natl Acad Sci USA 89 (16): 7811-7815, (Aug 15) 1992.
Arnold FH, "Protein engineering for abnormal environments", Current Opinion in Biotechnology # 4 (4): 450-455, 1993.
Ausubel FM et al.Current Protocols in Molecular Biology ("The latest protocol of molecular biologyVolume 1 and Volume 2 and Supplement, (aka “Red Book”), Green Publishing Assoc. , Brooklyn, NY, (copyright), 1987.
Ausubel FM et al.Current Protocols in Molecular Biology ("The latest protocol of molecular biologyVolume 1 and Volume 2 and Supplement, (aka “Red Book”), Green Publishing Assoc. , Brooklyn, NY, (copyright), 1989.
Ausubel FM et al.Short Protocols in Molecular Biology:   A Compendium of Methods from Current Protocols in Molecular Biology. ("Short Protocols in Molecular Biology: An Overview of Methods from Modern Protocols in Molecular Biology"), Green Publishing Assoc. , Brooklyn, NY, (copyright), 1989.
Ausubel FM et al.Short Protocols in Molecular Biology:   A Compendium of Methods from Current Protocols in Molecular Biology. ("Short Protocols in Molecular Biology: An Overview of Methods from Modern Protocols in Molecular Biology)), 2nd edition, Green Publishing Assoc. , Brooklyn, NY, (copyright), 1992.
Barbas CF III, Bain JD, Hoekstra DM, Lerner RA, "Semi-synthetic combinatorial antibody library: a chemical solution to a variety of problems", Proc Natl Acad Sci USA 89 (10): 4457-4461, 1992.
Bardwell AJ, Bardwell L, Johnson DK, Friedberg EC, "The yeast DNA recombination and repair proteins Rad1 and Rad10 constitute a complex via a localized hydrophobic domain in vivo", Mol Microbiol # 8 (6). ): 1177-1188, 1993.
Bartel P, Chien CT, Sternglanz R, Fields S, "Eliminating False Positives Arising in the Use of a Two-Hybrid System", Biotechniques 14 (6): 920-924, 1993.
Beaudry AA and Joyce GF, "Directed Evolution of RNA Enzymes", Science @ 257 (5070): 635-641,1992.
Berger and Kimmel,Methods in Enzymology ("Methods in enzymology"), Volume 152," Guide to Molecular Cloning Technology ", Academic Press, Inc. , San Diego, CA, (copyright), 1987. (Cumulative title index: 135-139, 141-167, 1990, 272)
Bevan M, "Binary Agrobacterium vector for plant transformation", Nucleic Acids Research # 12 (22): 8711-21, 1984.
Biocca S, Pierandrei-Amaldi P, Cattaneo A, "Intracellular expression of anti-p21ras single-chain Fv fragment inhibits meiotic maturation of Xenopus oocytes", Biochem Biophys Res Commun # 197 (2): 422-427. , 1993.
Bird et al., Plant MoI Biol {11: 651, 1988. .
Bogerd HP, Friedell RA, Blair WS, Cullen BR, "Genetic evidence that the Tat proteins of human immunodeficiency virus types 1 and 2 can multimerize in the nucleus of eukaryotic cells", J Virol # 67 (8): 5030 -5034, 1993.
Brederode FT, Koper-Zawroffoff EC, Bol JF, "Total nucleotide sequence of alfalfa mosaic virus RNA 4", Nucleic Acids Research # 8 (10): 2213-23, 1980.
Breitling F, Dubel S, Seehaus T, Klewinghaus I, Little M, "Surface Expression Vectors for Antibody Screening", Gene @ 104 (2): 147-153, 1991.
Brown NL, Smith M, "Cleavage specificity of restriction endonucleases isolated from Haemophilus gallinarum (Hga I)", Proc Natl Acad Sci USA 74 (8): 3213-6, (Aug) 1977.
Burton DR, Barbas CF III, Persson MA, Koenig S, Chanock RM, Lerner RA, "A giant array of human monoclonal antibodies to human immunodeficiency virus type 1 from a combinatorial library of asymptomatic seropositive individuals," Proc. Natl Acad Sci USA 88 (22): 10134-7, (Nov 15) 1991.
Caldwell RC and Joyce GF, "Gene randomization by PCR mutagenesis", PCR Methods Appl 2 (10): 28-33, 1992.
Caton AJ and Koproski H, "Influenza virus hemagglutinin-specific antibodies isolated from combinatorial expression libraries are closely involved in donor immune responses", Proc Natl Acad Sci USA # 87 (16): 6450- 6454, 1990.
Chakraborty T, Martin JF, Olson EN, "Analysis of oligomerization of myogenin and E2A products in vivo using a two-hybrid assay system", J Biol Chem # 267 (25): 17498-501, 1992.
Chang CN, Landolfi NF, Queen C, "Expression of Antibody Fab Domain on Bacteriophage Surface, Potential for Antibody Selection", J Immunol 147 (10): 3610-4, (Nov 15) 1991.
Chaudhary VK, Batra JK, Gallo MG, Willingham MC, FitzGerald DJ, Pastan I, "A method for rapidly cloning a functional variable region antibody gene of Escherichia coli as a single-chain immunotoxin", Proc NatlAcadSci 87 : 1066-1070, 1990.
Chien CT, Bartel PL, Sternglanz R, Fields S, "2-Hybrid System: Method for Identifying and Cloning Genes of Proteins Interacting with Protein of Interest", Proc Natl Acad Sci USA 88 (21): 9578- 9582, 1991.
Chiswell DJ, McCafferty J, "Phage antibodies: Will the new" coliclonal "antibodies replace monoclonal antibodies? ", Trends Biotechnol # 10 (3): 80-84, 1992.
Chothia C and Lesk AM, "Canon hypervariable region canonical structure", J MoI Biol 196 (4): 901-917, 1987.
Chothia C, Lesk AM, Tramontano A, Levitt M, Smith-Gill SJ, Air G, Sherif S, Padlan EA, Davies D, Tulip WR, et al. : 877-883, 1989.
Clackson T, Hoogenboom HR, Griffiths AD, Winter G, "Preparation of antibody fragment using phage display library", Nature 352 (6336): 624-628, 1991.
Conrad M, Topal MD, "DNA and spermidine provide a switch mechanism for regulating the activity of the restriction enzyme Nae I", Proc Natl Acad Sci USA 86 (24): 9707-11, (Dec) 1989. .
Coruzzi G, Broglie R, Edwards C, Chua NH, "Tissue-specific and light-regulated expression of the pea nucleus gene encoding the small subunit of ribulose-1,5-bisphosphate carboxylase", EMBO J # 3 (8 ): 1671-9, 1984.
Dasmahapatra B, DiDomenico B, Dwyer S, MaJ, Sadowski I, Schwartz J, "Genetic System for Studying the Activity of Proteolytic Enzymes," Proc Natl Acad Sci USA 891-989.
Davis LG, Dibner MD, Battery JF,Basic Methods in Molecular Biology. ("Basic methods of molecular biologyElsevier, New York, NY, (copyright), 1986.
Delegrave S and Youvan DC. {Biotechnology Research} 11: 1548-1552, 1993.
DeLong EF, Wu KY, Prezelin BB, Jobine RV, "Abundant Archaea in Picoplankton, Antarctic Ocean", Nature 371 (6499): 695-697, 1994.
Deng SJ, MacKenzie CR, Sadowska J, Michniewicz J, Young NM, Bundle Dr, Narang SA, "Selection of Antibody Single-Chain Variable Fragments with Improved Carbohydrate Binding by Phage Display", JBol, 9Bol. : 9533-9538, 1994.
Duan L, Bagrasra O, Laughlin MA, Oakes JW, Pomerantz RJ, "Strong inhibition of human immunodeficiency virus type 1 replication by intracellular anti-Rev single chain antibody", Proc Natl Acad Sci USA # 91 (11): 5075-. 5079, 1994.
Durfey T, Becherer K, Chen PL, Yeh SH, Yang Y, Kilburn AE, Lee WH, Elledge SJ, "The retinoblastoma protein binds to the type 1 protein phosphatase catalytic unit", Genes Dev55 * 7. -569, 1993.
Ellington AD and Szostak JW, "In vitro selection of RNA molecules that bind to specific ligands", Nature # 346 (6287): 818-822, 1990.
Fields S and Song 0, "A New Genetic System for Detecting Protein-protein Interactions", Nature # 340 (6230): 245-246, 1989.
Firek S, Draper J, Owen MR, Gandécha A, Cockburn B, Whitelam GC, “Secretization of functional single-chain Fv protein in transgenic tobacco plants and cell suspension cultures”, Plant Mol Biol 23 (4): 861-870. , 1993.
Forsblom S, Rigler R, Ehrenberg M, Philipson L, "Kinetic studies on cleavage of adenovirus DNA by restriction endonuclease Eco RI", Nucleic Acids Res @ 3 (12): 3255-69, (Dec) 1976.
Germino FJ, Wang ZX, Weissman SM, "Screening for protein-protein interactions in vivo", Proc Natl Acad Sci USA @ 90 (3): 933-937, 1993.
Gingeras TR, Brooks JE, "Pseudomonas aeruginosa-derived cloning restriction / modification system", Proc Natl Acad Sci USA # 80 (2): 402-6, 1983 (Jan).
Gluzman Y, "Monkey cells transformed with SV40 support replication of early SV40 mutants", Cell # 23 (1): 175-182, 1981.
Gruber M, Schodin BA, Wilson ER, Kranz DM, "Efficient tumor cell lysis via a bispecific single chain antibody expressed in E. coli", J Immunol # 152 (11): 5368-5374, 1994.
Guarente L, "Strategy for identification of interacting proteins", Proc Natl Acad Sci USA # 90 (5): 1639-1641, 1993.
Guilley H, Dudley RK, Jonard G, Balazs E, Richards KE, "Transcription of cauliflower mosaic virus DNA: detection of promoter sequence and characterization of transcripts", Cell @ 30 (3): 763-73, 1982.
Hardy CF, Sussel L, Shore D, "RAP1-interacting proteins involved in transcriptional silencing and telomere length regulation," Genes Dev # 6 (5): 801-814, 1992.
Hawkins RE and Winter G, "Cell Selection Strategies for Generating Antibodies from Different Gene Libraries: Trapping a Memory Pool", Eur J Immunol # 22 (3): 867-870, 1992.
Holvoet P, Laroche Y, Lijnen HR, Van Hoef B, Browers E, De Cock F, Lauwereys M, Gansemans Y, Collen D, a chimeric single-chain Fv fragment from a single-chain Fv kinase with a single-chain Fv kinase consisting of a single-chain Fv fragment of a single-chain Fv kinase of a fibrin-specific antibody. Biochemical Characterization of Genactivators ", Eur J Biochem # 210 (3): 945-952, 1992.
Honjo T, Alt FW, Rabbitts TH (eds.), Immunoglobulin genes. Academic Press: San Diego, Calif., Pp. 147-64. 361-368, (copyright), 1989.
Hoogenboom HR, Griffiths AD, Johnson KS, Chiswell DJ, Johnson P, Winter G, "Multi-subunit proteins on the surface of filamentous phage: a method for displaying antibody (Fab) heavy and light chains", Nucleic Acids (1919) ): 4133-4137, 1991.
Huse WD, Sastry L, Iverson SA, Kang AS, Alting-Mees M, Burton DR, Benkovic SJ, Lerner RA, "Preparation of a large-scale combinatorial library of immunoglobulin repertoires in phage λ", 2Scien, 2C492, Scen2 -1281, 1989.
Huston JS, Levinson D, Mudgett-Hunter M, Tai MS, Novotney J, Margolies MN, Ridge RJ, Bruccoli RE, Haber E, Crea R, etc .: Engineering of Antibody-Binding Protein Escherichia coli at the Escherichia coli Binding Site. Restoration of specific activity of Fv analogs ", Proc Natl Acad Sci USA # 85 (16): 5879-5883, 1988.
Iwabuchi K, Li B, Bartel P, Fields S, "Use of a 2-hybrid system to identify the domain of p53 involved in oligomerization", Oncogene # 8 (6): 1693-1696, 1993.
Jackson AL, Pahl PM, Harrison K, Rosmond J, Scrafani RA, "Cell cycle regulation of yeast Cdc7 protein kinase by binding to Dbf4 protein", Mol Cell Biol # 13 (5): 2899-2908, 1993.
Johnson S and Bird RE, Methods Enzymol @ 203: 88, 1991.
Kabat et al.Sequences of Proteins of Immunological Interest ("Sequence of the protein of interest"), 4th edition, U.S.A. S. Department of Health and Human Services, Bethesda, MD (1987)
Kang AS, Barbas CF, Janda KD, Benkovic SJ, Lerner RA, "Ligation of recognition and replication functions by assembling a combinatorial antibody Fab library on the surface of phage", Proc Natl Acad Sci USA 88 (10): 36 (4): 36 4366, 1991.
Kettleborough CA, Ansell KH, Allen RW, Rosell-Vives E, Gussow DH, Bendig MM, "Isolation of tumor cell-specific single-chain Fv from immunized mice using a phage antibody library and from these antibody fragments. Reconstruction of Whole Antibody ", Eur J Immunol # 24 (4): 952-958, 1994.
Kruger DH, Barcak GJ, Reuter M, Smith HO, "EcoRII can be activated to cleave resistant DNA recognition sites", Nucleic Acids Res 16 (9): 3997-4008, (May 11) 1988. Lalo D, Carls C, Sentenac A, Thuriaux P, "Interactions between the three common subunits of yeast RNA polymerase I and III", Proc Natl Acad Sci USA 90 (12): 5524-5528, 1993.
Laskowski MSr, "Purification and properties of snake venom phosphodiesterase", Methods Enzymol 65 (1): 276-84, 1980.
Lefkovits I and Pernis B (eds),Immunological Methods ("Immunological methodVolume I and Volume II, Academic Press, New York, NY. , Volume III (published in Orlando), and Volume IV (published in San Diego), (copyright), 1979-.
Ivan Lefkovits (ed.),Immunology methods manual : the comprehensive sourcebook of techniques. ("Immunological Method Manual: Comprehensive Technical DocumentAcademic Press, San Diego, (copyright), 1997.
Lerner RA, Kang AS, Bain JD, Burton DR, Barbas CF III, "Anti-immunized antibodies", Science # 258 (5086): 1313-1314, 1992.
Leung, D .; W. Et al., Technique, 1: 11-15, 1989.
Li B and Fields S, "Identification of p53 mutations affecting p53 binding to SV40 large T antigen using a yeast two-hybrid system", FASEB J # 7 (10): 957-963, 1993.
Lilly GG, Doelzal O, Hillyard CJ, Bernard C, Hudson PJ, "Recombinant single-chain antibody peptide conjugate expressed in E. coli for rapid diagnosis of HIV", J Immunol Methods 171 (2): 211-226. , 1994.
Lowman HB, Bass SH, Simpson N, Wells JA, "Selection of high affinity binding proteins by monovalent phage display", Biochemistry # 30 (45): 10832-10838, 1991.
Luban J, Bossolt KL, Franke EK, Kalpana GV, Goff SP, "The Gag protein of human immunodeficiency virus type 1 binds to cyclophilins A and B", Cell # 73 (6): 1067-1078, 1993.
Madura K, Dohmen RJ, Varshavsky A, "N-Recognin / Ubc2 interaction in the N-terminal rule pathway", J Biol Chem # 268 (16): 12046-54, (Jun 5) 1993.
Marks JD, Hoogenboom HR, Bonnert TP, McCafferty J, Griffiths AD, Winter G, "Bypass immunity: a human antibody derived from a phage display library of V genes", J MoI Biol 222 (3): 581.597, 581.597.
Marks JD, Griffiths Ad, Malmqvist M, Clackson TP, Bye JM, Winter G, "Bypass Immunization: Construction of High-Affinity Human Antibodies by Chain Shuffling", Biotechnology (NY) @ 10- (7): 79-79.
Marks JD, Hoogenboom HR, Griffiths AD, Winter G, "Molecular evolution of proteins on filamentous phage: mimicking the strategy of the immune system", J Biol Chem # 267 (23): 16007-16010, 1992.
Maxam AM, Gilbert W, "Sequencing of end-labeled DNA using base-specific chemical cleavage", Methods Enzymol @ 65 (1): 499-560, 1980.
McCafferty J, Griffiths AD, Winter G, Chiswell DJ, "Phage antibody: filamentous phage displaying antibody variable domains", Nature 348 (6301): 552-554, 1990.
Miller JH. ,A Short Course in Bacterial Genetics: A Laboratory Manual and Handbook for Escherichia coli and Related Bacteria ("Bacteriological Genetics Short Course: Laboratory Manual and Handbook on Escherichia coli and Related Bacteria)) (See also page 445), Cold Spring Harbor Laboratory Press, Plainview, NY, (copyright), 1992.
Milne GT and Weaver DT, "The dominant negative allele of RAD52 reveals a DNA repair / recombination complex containing Rad51 and Rad52", Genes Dev # 7 (9): 1755-1765, 1993.
Mullinax RL, Gross EA, Amberg JR, Hay BN, Hogrefe HH, Kubiz MM, Greener A, Alting-Mees M, Ardourel D, Short-to-library-specific immunity to bacteriophage λ in humans, and Bacteriophage λ in humans Identification of fragment clones ", Proc natl Acad Sci USA # 87 (20): 8095-9099, 1990.
Nath K, Azzolina BA, Gene Amplification and Analysis (Chirikian JG (ed.)), Volume 1, p. 113, Elsevier North Holland, Inc. , New York, New York, (copyright), 1981.
Needleman SB and Wunsch CD, "A General Method Applicable to Search for Similarities in the Amino Acid Sequences of Two Proteins", J Mol Biol # 48 (3): 443-453, 1970.
Nelson M, Christ C, Schildkraut I, "Changes in Apparent Restriction Endonuclease Recognition Specificity by DNA Methylase", Nucleic Acids Res @ 12 (13): 5165-73, 1984 (Jul 11).
Nichols PJ, Johnson VG, Andrew SM, Hoogenboom HR, Raus JC, Youle RJ, "Characterization of single-chain antibody (sFv) -toxin fusion protein produced in rabbit reticulocyte lysate in vitro", JBiC68C (7): 5302-5308, 1993.
Oler AR, Vanden Broek W, Conrad M, Topal MD, "The ability of DNA and spermidine to affect the activity of restriction endonucleases from several bacterial species", Biochemistry 30 (9): 2543-9, (Mar5 1991.
Owens RJ and Young RJ, "Genetic Engineering of Monoclonal Antibodies", J Immunol Methods @ 168 (2): 149-165, 1994.
Pearson WR and Lipman DJ, "An Improved Tool for Biological Sequence Comparison", Proc Natl Acad Sci USA 85 (8): 2444-2448, 1988.
Pein CD, Reuter M, Meisel A, Cech D, Kruger DH, "Activation of restriction endonuclease EcoRII does not depend on cleavage of stimulator DNA", Nucleic Acids Res 19 (19): 5139-42, (Oct) 11) 1991.
Persson MA, Caothien RH, Burton DR, "Preparation of Various High-Affinity Human Monoclonal Antibodies by Repertoire Cloning", Proc Natl Acad Sci USA # 88 (6): 2432-2436, 1991.
Queen C, Foster J, Stauber C, Stafford J, "Cell-type-specific regulation of κ-immunoglobulin genes by promoter and enhancer elements," Immunol Rev # 89: 49-68, 1986.
The apparent specificity of Qiang BQ, McClellan M, Poddar S, Spokauska A, Nelson M, "NotI (5'-GCGGCCGC-3 ') was determined by M.FnuDII or M.BepI methyltransferase (5'-GC-C). '): Cleavage of bacterial chromosomes into several large fragments ", Gene # 88 (1): 101-5, (Mar 30) 1990.
Raleigh EA, Wilson G, "Escherichia coli strain K-12 restricts DNA containing 5-methylcytosine", Proc Natl Acad Sci USA A 83 (23): 9070-4, (Dec) 1986.
Reidhaar-Olson JF and Sauer RT, "Combinatorial Alkaset Mutagenesis as a Probe of the Information Content of Protein Sequences", Science # 241 (4861): 53-57, 1988.
Riechmann L and Weill M, "Phage display and selection of site-specific random single-chain antibody Fv fragments for improved affinity of Fv fragments," Biochemistry # 32 (34): 8848-8855, 1993.
Roberts RJ, Macelis D, "REBASE-restriction enzymes and methylases", Nucleic Acids Res # 24 (1): 223-35, (Jan 1) 1996.
Ryan AJ, Royal CL, Hutchinson J, Shaw CH, "Genomic Sequence of 12S Seed Conserved Protein from Brassica napus or jet neuf", Nucl Acids Res # 17 (9): 3584, 1989.
Sambrook J, Fritsch EF, Maniatis T. ,Molecular Cloning: A Laboratory Manual. ("Molecular cloning: laboratory manual"), Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, (copyright), 1982.
Sambrook J, Fritsch EF, Maniatis T. ,Molecular Cloning: A Laboratory Manual. ("Molecular cloning: laboratory manual)), Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, (copyright), 1989.
Scopes RK. ,Protein Purification: Principles and Practice. ("protein Purification: Principles and PracticeSpringer-Verlag, New York, NY, (copyright), 1982.
Silver SC and Hunt SW III, "Cloning techniques for cDNAs encoding interacting transcription regulatory proteins", Mol Biol Rep # 17 (3): 155-165, 1993.
Smith TF, Waterman MS. {Adv Appl. Math} 2: 482, last page of dissertation, 1981.
Smith TF, Waterman MS, "Duplicate Genes and Information Theory", J Theor Biol # 91 (2): 379-80, (Jul 21) 1981.
Smith TF, Waterman MS, "Identification of common molecular subsequences", J Mol Biol @ 147 (1): 195-7, (Mar 25) 1981.
Smith TF, Waterman MS, Fitch WM, “Comparative biological sequence metrics”, J MoI Evol @ S18 (1): 38-46, 1981.
Staudinger J, Perry M, Elledge SJ, Olson EN, "Interaction between vertebrate helix-loop-helix proteins in yeast using a two-hybrid system", J Biol Chem # 268 (7): 4608-4611, 1993.
Stemmer WP, Morris SK, Wilson BS, "Selection of an active single-chain Fv antibody derived from a protein linker library prepared by enzymatic reverse PCR", Biotechniques # 14 (2): 256-265, 1993.
Stemmer WP, "DNA shuffling by random fragmentation and rearrangement: recombination in vitro for molecular evolution", Proc Natl Acad Sci USA 91 (22): 10747-10751, 1994.
Sun D, Hurley LH, "Effects of (+)-CC-1065- (N3-adenine) DNA adduct on in vitro DNA synthesis via E. coli DNA polymerase", Biochemistry 31:10, 2822-9, (Mar 17). 1992,
Tague BW, Dickinson CD, Chrispeels MJ, "The short domain of the plant vacuolar protein phytohemagglutinin targets yeast in vacuo invertase", Plant Cell 2 (6): 533-46, (June) 1990.
Takahashi N, Kobayashi I, "Evidence for a double-strand break repair model of bacteriophage lambda recombination", Proc Natl Acad Sci USA 87 (7): 2790-4, (Apr) 1990.
Thiesen HJ and Bach C, "Target Detection Assay (TDA): A Universal Method for Determining DNA Binding Sites as Demonstrated on SP1 Protein", Nucleic Acids Res @ 18 (11): 3203-3209, 1990.
Thomas M, Davis RW, "Study on Cleavage of Bacteriophage λ by EcoRI Restriction Endonuclease", J Mol Biol 91 (3): 315-28, (Jan 25) 1975.
Tingey SV, Walker EL, Corruzzi GM, "The pea glutamine synthase gene encodes different polypeptides specifically expressed in leaves, roots and nodes" EMBO J # 6 (1): 1-9, 1987. .
Topal MD, Thresher RJ, Conrad M, Griffith J, "NaeI endonuclease that binds to pBR322 DNA induces looping", Biochemistry @ 30 (7): 2006-10, (Feb. 19) 1991.
Tramontano A, Chothia C, Lesk AM, "Structural residue 71 is a major determinant of the position and conformation of the second hypervariable region in the immunoglobulin VH domain", J Mol Biol 215 (1). : 175-182, 1990.
Turk C and Gold L, "Phylogenetic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase", Science # 249 (4968): 505-510, 1990.
van de Poll ML, Lafleur MV, van Gog F, Vriering H, Meerman JH, "N-acetylated and deacetylated 4'-fluoro-4-aminobiphenyl and 4-aminobiphenyl adducts are single-stranded M13 in differ in their ability to inhibit DNA replication in vitro and single-stranded φX174 in E. coli ”, Carcinogenesis 13 (5): 751-8, (May) 1992.
Vojtek AB, Hollenberg SM, Cooper JA, "Mammalian Ras interacts directly with serine / threonine kinase Raf", Cell # 74 (1): 205-214, 1993.
Wenzler H, Mignery G, Fisher L, Park W, "Sucrose-regulated expression of chimeric potato tuber genes in leaves of transgenic tobacco plants", Plant Mol Biol # 13 (4): 347-54, 1989.
Williams and Barclay,Immunoglobulin Genes,The Immunoglobulin Gene Superfamily ("Immunoglobulin gene,Immunoglobulin gene superfamily")
Winnacker EL. ,From Genes to Clones: Introduction to Gene Technology. (“From Gene to Clone: An Introduction to Gene Technology”), VCH Publishers, New York, NY, (copyright), 1987.
Winter G and Milstein C, "Artificial antibodies", Nature 349 (6307): 293-299, 1991.
Yang X, Hubbard EJ, Carlson M, "Protein Kinase Substrates Identified by the Two-Hybrid System", Science # 257 (5070): 680-2, (Jul 31) 1992.
U.S. Pat. No. 4,683,195; filed on Feb. 7, 1986, issued on Jul. 28, 1987. Mullis KB, Erlich HA, Arnheim N, Horn GT, Saiki RK, Scharf SJ, "Methods for amplifying, detecting and / or cloning nucleic acid sequences"
U.S. Patent No. 4,683,202; filed October 25, 1985, issued July 28, 1987. Mullis KB, “Method for amplifying nucleic acid sequence”
U.S. Patent No. 4,704,362; filed November 5, 1979, issued November 3, 1987. Itakura K, Riggs AD, “Expression of recombinant cloning vehicle microbial polypeptide”
WO 88/08453; filed on April 14, 1988, published November 3, 1988. Alakhov JB, Baranov, VI, Ovodov SJ, Ryanova LA, Spirin AS, "Method for obtaining polypeptide in cell-free translation system"
WO 90/05785; filed on November 15, 1989, published May 31, 1990. Schultz P, “Method for site-specific incorporation of unnatural amino acids into proteins”
WO 90/07003; filed on January 27, 1989, published on June 28, 1990. Baranov VI, Morozov IJ, Spirin AS, “Methods for Preliminary Expression of Genes in Conjugated Transcription / Translation in Cell-Free Systems”
WO 91/02076; filed on June 14, 1990, published February 21, 1991. Baranov VI, Ryabova LA, Yarchuk OB, Spirin AS, “Method for obtaining polypeptide in cell-free system”
WO 91/05058; filed October 5, 1989, published April 18, 1991. Kawasaki G, “Cell-free system and isolation of novel genes and polypeptides”
WO 91/17271; filed May 1, 1990, published November 14, 1991. Dower WJ, Cwirla SE, "Method for screening recombinant library"
WO 91/18980; filed on May 13, 1991, published on December 12, 1991. Devlin JJ, “Compositions and Methods for Identifying Biologically Active Molecules”
WO 91/19818; filed on June 20, 1990, published on December 26, 1991. Dower WJ, Cwirla SE, Barrett RW, "Peptide library and screening system"
WO 92/02536; filed on August 1, 1991, published February 20, 1992. Gold L, Tuerk C, "Systematic polypeptide evolution by reverse translation"
WO 92/03918; filed on August 28, 1991, published March 19, 1992. Lonberg N, Kay RM, “Transgenic non-human animals capable of producing heterologous antibodies”
WO 92/03918; filed on August 28, 1991, published March 19, 1992. Lonberg N, Kay RM, “Transgenic non-human animals capable of producing heterologous antibodies”
WO 92/05258; filed on September 17, 1991, published on April 2, 1992. Fincher GB, "The gene encoding the barley enzyme"
WO 92/14843; filed on February 21, 1992, published September 3, 1992. Toole JJ, Griffin LC, Bock LC, Latham JA, Muenchau DD, Krawczzyk S, “Biomolecule-specific aptamers and methods for producing them”
WO 93/08278; filed October 15, 1992, published April 29, 1993. Schatz PJ, Cull MG, Miller JF, Stemmer WP, “Peptide library and screening method thereof”
WO 93/12227; filed on December 17, 1992, published June 24, 1993. @Lonberg, N; Kay RM, "Transgenic non-human animals capable of producing heterologous antibodies"
WO 93/12227; filed on December 17, 1992, published June 24, 1993. Lonberg N, Kay RM, “Transgenic non-human animals capable of producing heterologous antibodies”
WO 94/25585; filed on April 25, 1994, published November 10, 1994. Lonberg, N, Kay RM, “Transgenic non-human animals capable of producing heterologous antibodies”
WO 94/25585; filed on April 25, 1994, published November 10, 1994. Lonberg N, Kay RM, “Transgenic non-human animals capable of producing heterologous antibodies”
Arslan T, Abraham AT, Hecht SM, "Structurally altered substrate of DNA topoisomerase I メ Effect of including one 3'-deoxynucleotide in a cleavable strand", Nucleosides Nucleotides 1998 Jan-Mar; 17 (1-3 ): 515-30.
Aupix K, Toulme JJ, "Binding of chemically modified oligonucleotides to the double-stranded base of RNA hairpin", Nucleosides Nucleotides 1999 Jun-Jul; 18 (6-7): 1647-50.
Bazzanini R, Manfredini S, Durini E, Groschel B, Cinatl J, Balzarini J, De Clercq E, Imbach JL, Perigad C, Gosselin G, Bio-ethyl-S-acyl, thio-Sacyl Prodrugs of Ara-CMP and Ara-AMP with: Synthesis and Biological Evaluation ", Nucleosides Nucleotides 1999 Apr-May; 18 (4-5): 971-2.
Blackburn GM, Liu X, Rosler A, Brenner C, "Two hydrolase resistance analogs of diadenosine 5 ', 5'"-P1, P3-triphosphate for studies on human fragile histidine trivalent protein (Fhit). Body ", Nucleosides Nucleotides 1998 Jan-Mar; 17 (1-3): 301-8.
Brickson PK, Lin X, Melman N, Ji XD, Jacobson KA, "Synthesis of 7-β-D-ribofuranosylxanthine and Adenosine Receptor Affinity", Nucleosides Nucleotides 1998 Apr; 17 (68): 79.
Brodin P, Gottik M, Auclair C, Mouscadet JF, "Inhibition of HIV-1 Integration by Mono- and Bifunctional Triple Helix-forming Oligonucleotides", Nucleosides Nucleides 1999 Jun-Jul; 18 (6-7): 17 (17): 8.
Creighton TE, Proteins Structures and Molecular Principles. (“Protein Structure and Molecular Principles”), New York: H. Freeman and Co. , 1984.
De Clercq E, "Carbocyclic adenosine analogs as S-adenosylhomocysteine hydrolase inhibitors and antivirals: recent advances", Nucleosides Nucleotides 1998 Jan-Mar; 17 (1-3): 625-34.
de Zwart M, Link R, von Frijtag Drabbe Kunzel JK, Cristalli G, Jacobson KA, Townsend-Nicholson A, IJzerman AP of the potent adenosine A2c receptor adenosine A2c receptor adenosine A2B receptor adenosine A2B receptor adenosine A2c receptor. 1998 Jun; 17 (6): 969-85.
Egron D, Arzumanov AA, Dyatkina NB, Krayevsky A, Imbach JL, Aubertin AM, Gosselin G, Perigaud C, "3'-azido-2 ', 3'-dideoxythymidine, antioxidant activity And Stability Studies ", Nucleosides Nucleotides 1999 Apr-May; 18 (4-5): 983-3-4
Gianolio DA, McLaughlin LW, "Synthesis and Triplex Formation Properties of Pyrimidine Derivatives with Extended Functions", Nucleosides Nucleotides 1999 Aug; 18 (8): 1751-69.
Gottik MB, Volkov EM, Romanova EA, Oretskaya TS, Shabarova ZA, "Synthesis of Oligonucleotide Insertion Agent Conjugates That Can Inhibit HIV-1 DNA Incorporation", Nucleosides Jucleido-Jude7-99: 1645-6.
Hotda H, Koizumi M, Ohmine T, Furukawa H, Nishigaki T, Abe K, Kosaka T, Tsutsumi S, Sone J, Kaneko M with anti-nucleotide ribonucleotide having a biologically active oligodeoxyribodeoxyribodeoxyribodeoxyribodeoxyglycoribonucleotide -1 activity and stability ", Nucleosides Nucleotides 1998 Jan-Mar; 17 (1-3): 243-52.
JP10113194; filed October 22, 1997, published May 6, 1998, Donnelly, JJ; Dwarki, VJ; Liu, MA; Montgomery, DL; Parker, S; Shiver, JW;
Kang SH, Sinhabubu AK, Cho MJ, Synthesis of Bis (pivaloyloxymethyl) ester of 2'-Deoxyuridine 5'-Monophosphate and Its Biological Activity ", Nucleosides Nucleotides 1998 Jun; 17 (6): 1089-98.
Krayevsky A, Arzumanov A, Shirokova E, Dyatkina N, Victorova L, Jasko M, Alexandrova L, "dNTPs modified with triphosphate residues: stability of dsNu in the human serum and d-NTPs in human serum". Mar; 17 (1-3): 681-93.
"Krayevsky AA, Dyatkina NB, Semizarov DG, Victorova LS, Shirokova EA, Theil F, Von Janta Lipinski MJ, Gosselin G" Apr-May; 18 (4-5): 863-4.
Kvasyuk EI, Mikhailopulo IA, Suhadolnik RJ, Henderson EE, Mut NF, Iacono KT, Homon J, Pfleiderer W, "5'-terminal 5'-amino-5'-amino-5'-amino-5'-deoxy. Synthesis of 2 ', 5'-oligoadenylic acid trimer containing -dideoxyadenosine derivative and its biological activity ", Nucleosides Nucleotides 1999 Jun-Jul; 18 (6-7): 1483-4.
Liu J, Skradis A, Kolar C, Kolath J, Anderson J, Lawson T, Talmadge J, Gmeiner WH, "Increased cytotoxicity and reduced in vivo radioactivity of FdUMP [10] compared to 5-FU" 1999 Aug; 18 (8): 1789-802.
Lutz MJ, Will DW, Breipohl G, Benner SA, Uhlmann E, "Synthesis of single charged peptide nucleic acid (PNA) analogs and their recognition as substrates by DNA polymerases", Nucleosides Nucleotides 1999; 401.
Monaco V, van de Watering KI, Meeuwenood NJ, van den Elst HA, Stuenberg Berg HR, Visse R, van der Kaden JC, Moenaer GF, Moolenaar GF, Veroen. Synthesis and Biological Evaluation of Modified DNA Fragments for Studies on Repair ", Nucleosides Nucleotides 1999 Jun-Jul; 18 (6-7): 1339-41.
Morozova OV, Kolpashchikov DM, Ivanova TM, Godoviva TS, "Synthesis of novel photocrosslinked 5-C base-substituted UTP analogs and their application in highly selective affinity labeling of tick-borne encephalitis virus RNA replicase proteins", NucleosidesResid. -Jul; 18 (6-7): 1513-4.
Nguyen-Ba N, Chan L, Quimper M, Turcotte N, Lee N, Mitchell H, Bedard J, "Design and SAR Study of New Classes of Nucleotide Analogues as Potent Anti-HCMV Agents", Nucleosides NudeMice-Analyse-Analysis-Nudes-Aids-Amure. 18 (4-5): 821-7.
Pandolfi D, Rauzi F, Capobianco ML, "Evaluation of Different Types of End-Capping Modifications on the Stability of Oligonucleotides to 3'- and 5'-Exonucleases", Nucleosides Nucleotides 1999 Sep; 18 (9): 2051-69.
Pankiewicz KW, Lesiak-Watanabe K, "New mycophenol adenine bis (phosphate) as a potent anticancer agent and cell differentiation inducer", Nucleosides Nucleotides 1999 Apr-May; 18 (4-5): 927-32.
Perrin DM, Garestier T, Helene C, "Extending the catalytic repertoire of nucleic acid catalysts: Simultaneous incorporation of two modified deoxyribonucleoside triphosphates with ammonium and imidazolyl functions", Nucleosides Nucleotides 1999 Mar; 18 (3): 377-. 91.
Pfundheller HM, Koshkin AA, Olsen CE, Wengel J, "Evaluation of oligonucleotides containing two novel 2'-O-methyl modified nucleotide monomers: 3'-C-allyl and 2'-O, 3'-C-linked Member Derivatives ", Nucleosides Nucleotides 1999 Sep; 18 (9): 2017-30.
Ramasamy KS, Stoisavljevic V, "Synthesis of Modified Oligonucleotides Containing Acyclic Amino Alcohol Nucleoside Analogues and Biophysical Studies Thereof," Nucleosides Nucleotides 1999 August; 18 (8): 1845-61.
Schinazi RF, Lesnikowski ZJ, "Boron-containing oligonucleotides", Nucleosides Nucleotides 1998 Jan-Mar; 17 (1-3): 635-47.
Secrist JA III, Parker WB, Allan PW, Bennett LL Jr, Waud WR, Truss JW, Fowler AT, Montgomery JA, Ealick SE, Wells AG, Wells G. Activation of Nucleoside Prodrug by Nucleoside Phosphorylase ", Nucleosides Nucleotides 1999 Apr-May; 18 (4-5): 745-57.
Shirokova EA, Shipitsin AV, Victorova LS, Dyatkina NB, Goryunova LE, Beabealashvilli RS, Hamilton CJ, Roberts SM, Krayevsky AA, "modified nucleoside 5'-triphosphate as a novel antiviral agent", Nucleosides Nucleotides 1999 Apr-May 18 (4-5): 1027-8.
Srivastava TK, Friedhoff P, Pinhoud A, Katti SB, "Application of methylphosphonate oligonucleosides in studies on phosphodiester hydrolysis by Serratia endonuclease", Nucleosides Nucleotides 1999: 1945;
Stattel JM, Yanachkov I, Wright GE, “Synthesis and biochemical studies of N2- (pn-butylphenyl) -2′-deoxyguanosine 5 ′-(α, β-imido) triphosphate (BuPdGMPNHPP): Non-substrate inhibitors of B family DNA polymerases ", Nucleosides Nucleotides 1998 August; 17 (8): 1505-13.
Terato H, Morita H, Ohyama Y, Ide H, "New modification of 5-formyluracil with cysteine derivatives in aqueous solution", Nucleosides Nucleotides 1998 Jan-Mar; 17 (1-3): 131-41.
Tomica A, Seno M, Sato-Kiyotaki K, Ohtsuki C, Hirai T, Yamaguchi T, Kawaguchi T, Yoshida S, Sanyo N-Sy-N-Sy-N-Sy-N-Sy-N-Sy-N-Sy-N-Sy-N-Sy-N. Selective inhibition of eukaryotic DNA polymerase α by 2- (pn-butylanilino) adenine 5′-triphosphate (BuAaraATP) and its 2′-up azide analog: synthesis and enzymatic evaluation ”, Nucleosides Nucleotides 1998. Jan-Mar; 17 (1-3): 487-501.
U.S. Pat. No. 5,580,859; filed on Mar. 18, 1994; issued on Dec. 3, 1996. Felgner, PL. Wolff, JA. Rhodes, GH. Malone, RW. Carson, DA. "Delivery of exogenous DNA sequences in mammals"
U.S. Pat. No. 5,589,466; filed on Jan. 26, 1995, issued on Dec. 31, 1996. Felgner, PL. Wolff, JA. Rhodes, GH. Malone, RW. Carson, DA. "Induction of a protective immune response in mammals by injection of DNA sequences"
U.S. Pat. No. 5,641,665; filed on Nov. 28, 1994, issued on Jun. 24, 1997. Hobart, PM. Margarith, M; Parker, SE. Khatibi, S, "Plasmids Suitable for Expression of IL-2"
U.S. Pat. No. 5,693,622; filed on June 7, 1995, issued on Dec. 2, 1997. Wolff, JA. Duke, DJ. Felgner, PL. , "Expression of exogenous polynucleotide sequences in mammalian myocardium"
U.S. Pat. No. 5,703,055; filed on Jan. 26, 1994; issued on Dec. 30, 1997. Felgner, PL. Wolff, JA; Rhodes, GH. Malone, RW; Carson, DA. , “Production of antibodies by lipid-mediated DNA delivery”
U.S. Pat. No. 5,846,946; filed on Jun. 14, 1996, issued on Dec. 8, 1998. Huebner, RC. Norman, JA. Liang, X; Carner, KR. Barbour, AG. Luke, CJ. , "Compositions and methods for administering Borrelia DNA"
US Patent No. 5,910,488; filed December 1, 1995, issued June 8, 1999. Nabel, GJ. Nabel, EG. Lew, D; Marquett, M, "Plasmids Suitable for Gene Therapy"
Victorova LS, Semizarov DG, Shirokova EA, Alexandrova LA, Arzumanov AA, Jasko MV, Krayevsky AA, modified with a human DNA polymerase and retrovirus reverse transcriptase Nc transcriptase Ns with transcriptase Ns. Apr-May; 18 (4-5): 1031-2.
von Janta-Lipinski M, Gaertner K, Lehmann C, Scheer H, Schilddt J, Matthes E, "Protein and RNA of human telomerase as targets for modified oligonucleotides", Nucleosides Nuclei Jude7-Jul 19 : 1719-20
WO9011092; filed on March 21, 1990, and published on October 4, 1990, A1. Felgner, PL. Wolff, JA; Rhodes, GH. Malone, RW; Carson, DA. , "Expression of exogenous polynucleotide sequences in vertebrates"
WO9314778; published on January 21, 1993, A1 on August 5, 1993. Rhodes, GH. Dwarki, VJ. Felgner, PL; Wang-Felgner, J; Manthorpe, M, "Gene transfer in ex vivo".
WO942717; A1 published on March 14, 1994, and September 29, 1994. Donnelly, JJ. Dwarki, VJ. Liu, MA. Montgomery, DL. Parker, SE. Shiver, JW. Ulmer, JB. , "Nucleic acid medicine"
WO9633736; filed on April 26, 1996, A1 published October 31, 1996. Baruch DI; Pasloske BL; Howard, RJ, "Malaria Peptides and Vaccines"
WO9735992; filed on March 17, 1997, A1 published on October 2, 1997. Hobart, PM. Liang, X, "Tetracycline induction / inhibition system"
WO9926663; filed on November 20, 1998, and published on June 3, 1999, A2. Horton, H; Parker, S; Manthorpe, M; Felgner, P, "Treatment of cancer with cytokine-expressing polynucleotides and compositions therefor".
WO9941368; filed February 10, 1999, A2 published August 19, 1999. Punnonen J, Stemmer WP, Whalen RG; Howard, R, "Optimization of immunomodulatory properties of genetic vaccines"
WO9941369; filed February 10, 1999, A2 published August 19, 1999. Punnonen J, Stemmer WP, Whalen RG; Howard, R, "Gene vaccine vector engineering"
WO9941383; filed February 10, 1999, A1 published August 19, 1999. Punnonen J, Bass, SH, Whalen, RG, Howard, R, Stemmer, WP, "Antigen library immunization"
WO9941402; filed on February 10, 1999, published on August 19, 1999, A2. Punnonen J, Stemmer, WP, Howard R, Patten PA, "Targeting Gene Vaccine Vectors"
[Brief description of the drawings]
FIG.
FIG. 1 shows the activity of the enzyme exonuclease III. This is a typical enzyme that can be used to shuffle, assemble, reassemble, reassociate and / or concatenate polynucleotide building blocks. The asterisk indicates that this enzyme acts from the 3 'direction to the 5' direction of the polynucleotide substrate.
FIG. 2
FIG. 2 shows an example of application of the enzyme exonuclease III in exonuclease-mediated polynucleotide reassembly. A suitable host (eg, Escherichia coli, Pseudomonas, Streptomyces, or Bacillus) is transformed and, utilizing the repair machinery of that host, cloned and mutated progeny nucleic acids (and Also shown is the combined use of "repair" in vivo, by creating a library of polypeptides (preferably expressed by such nucleic acids) to provide additional diversity.
FIG. 3
FIG. 3 shows the generation of a multi-attached nucleic acid strand. In this case, the resulting chain is of the same length as the parent template, but is not methylated. Thus, the resulting strand can be selected using DpnI treatment. Although not shown, the template as well as the product produced may be part of a vector (linear or circular).
FIG. 4
FIG. 4 shows the use of exonuclease treatment as a means to release 3 'and 5' terminal nucleotides from the unhybridized single-stranded ends of an annealed nucleic acid strand in a heterologous nucleic acid complex. This treatment releases short, but hybridized ends, facilitating polymerase-based extension and / or ligase-mediated ligation of the treated ends.
Alternatively, a suitable host (eg, E. coli, Pseudomonas, Streptomyces, or Bacillus) can be transformed and the cloned, mutated progeny nucleic acid can be analyzed by expression screening using the host's repair machinery. Also shown is the combined use of "repair" in vivo by creating additional libraries by producing libraries of (and preferably polypeptides expressed by such nucleic acids).
FIG. 5
FIG. 5 shows the use of exonuclease-mediated reassembly of nucleic acids in an example of annealing one methylated multi-binding nucleic acid strand to several unmethylated single-binding nucleic acid strands. Means for forming the heterologous nucleic acid complex and releasing 3 'and 5' terminal nucleotides from the unhybridized single-stranded ends of the plurality of annealed nucleic acid strands in the heterologous nucleic acid complex As exonuclease treatment. This treatment releases short, but hybridized ends, facilitating polymerase-based extension and / or ligase-mediated ligation of the treated ends. It is then convenient to treat with DpnI for subsequent selection on the chimeric, unmethylated, generated annealed single binding nucleic acid strand in nature.
FIG. 6
FIG. 6 illustrates the use of exonuclease-mediated reassembly of nucleic acids in an embodiment in which multiple methylated multi-attached nucleic acid strands are annealed to several unmethylated single-attached nucleic acid strands. Means for forming the heterologous nucleic acid complex and releasing 3 'and 5' terminal nucleotides from the unhybridized single-stranded ends of the plurality of annealed nucleic acid strands in the heterologous nucleic acid complex As exonuclease treatment. This treatment releases short, but hybridized ends, facilitating polymerase-based extension and / or ligase-mediated ligation of the treated ends. Subsequently, treatment with DpnI is convenient for selection against chimeric, unmethylated, generated annealed single-binding nucleic acid strands in nature.

Claims (14)

突然変異させた子孫ポリヌクレオチドの作製方法であって、
(a) 出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製する、
これにより、エキソヌクレアーゼ仲介再集合プロセスは、3’アンダーハングおよび平滑末端に作用する3’エキソヌクレアーゼで処理(例えば、エキソヌクレアーゼIIIを用いて処理)し、出発二本鎖ポリヌクレオチドから5’末端ではなく3’末端のヌクレオチドを遊離させ、部分的もしくは完全にその元の相手を含まない残った鎖を残存させることにより、非限定的な様式で例示され、所望であれば、残った鎖を、別の相手とのハイブリダイゼーションを達成するために使用することができ、;
これにより、エキソヌクレアーゼ仲介再集合プロセスがさらに、5’アンダーハングに作用する5’エキソヌクレアーゼで処理(例えば、レッドアルファ遺伝子産物を用いて処理)することにより、出発二本鎖ポリヌクレオチドから5’末端のヌクレオチドを遊離させ、部分的もしくは完全にその元の相手を含まない残った鎖を残存させることにより、非限定的な様式で例示され、所望であれば、残った鎖を、別の相手とのハイブリダイゼーションを達成するために使用することができ、;
これにより、エキソヌクレアーゼ仲介再集合プロセスがさらに、ハイブリダイズしていない末端等のオーバーハング末端に作用するエキソヌクレアーゼで処理(例えば、Mung Bean NucleaseまたはS1ヌクレアーゼまたは大腸菌DNAポリメラーゼを用いて処理)することにより、ヘテロ核酸複合体中のアニーリングさせた核酸鎖のハイブリダイズしていない一本鎖末端から末端ヌクレオチドを遊離させ、短くされているがハイブリダイズした末端を残存させることにより処理末端のポリメラーゼに基づく伸長および/またはリガーゼ仲介型連結を促進する、ことにより非限定的な様式で例示され、;
さらにこれにより、エキソヌクレアーゼ仲介再集合プロセスが、例えば、アンダーハング末端もしくは平滑末端から末端ヌクレオチドを遊離させるエキソヌクレアーゼおよびハイブリダイズしていない末端等のオーバーハング末端から末端ヌクレオチドを遊離させるエキソヌクレアーゼの両方を同時ではなく用いることにより実施することができる二重処理によっても例示される;
ことを含んでなる前記方法。
A method for producing a mutated progeny polynucleotide, comprising:
(A) generating a set of progeny polynucleotides by subjecting the set of starting or parent polynucleotides to an exonuclease-mediated reassembly process in vitro;
This allows the exonuclease-mediated reassembly process to be treated with a 3 'exonuclease that acts on the 3' underhang and blunt ends (e.g., with exonuclease III), and to remove the 5 'end from the starting double stranded polynucleotide. Rather, it is exemplified in a non-limiting manner by releasing the nucleotide at the 3 'end, leaving the remaining strand partially or completely free of its original partner, and removing the remaining strand if desired. Can be used to achieve hybridization with another partner;
This allows the exonuclease-mediated reassembly process to further 5 ′ from the starting double-stranded polynucleotide by treatment with a 5 ′ exonuclease that acts on the 5 ′ underhang (eg, with the red alpha gene product). Illustrated in a non-limiting manner, by releasing terminal nucleotides and leaving the remaining strand partially or completely free of its original partner, the remaining strand can be replaced with another partner if desired. Can be used to achieve hybridization with
This allows the exonuclease-mediated reassembly process to be further treated with an exonuclease that acts on overhanging ends, such as the unhybridized ends (eg, with Mung Bean Nuclease or S1 nuclease or E. coli DNA polymerase). By releasing the terminal nucleotides from the unhybridized single-stranded ends of the annealed nucleic acid strands in the heteronucleic acid complex and leaving the shortened but hybridized ends based on the treated end polymerase Exemplified in a non-limiting manner, by promoting extension and / or ligase-mediated ligation;
In addition, this allows the exonuclease-mediated reassembly process to both release exonucleases that release terminal nucleotides from underhanging or blunt ends, and exonucleases that release terminal nucleotides from overhanging ends, such as unhybridized ends. Also exemplified by a double treatment that can be performed by using rather than simultaneously;
The method comprising:
突然変異させた子孫ポリヌクレオチドを作製するための請求項1に記載の方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットを3’アンダーハングおよび平滑末端に作用する3’エキソヌクレアーゼで処理して、5’末端ではなく3’末端のヌクレオチドを遊離させる、
これにより、該3’エキソヌクレアーゼは、エキソヌクレアーゼ(例えば、エキソヌクレアーゼIII)で処理し、出発二本鎖ポリヌクレオチドから5’末端ではなく3’末端のヌクレオチドを遊離させ、部分的もしくは完全にその元の相手を含まない残った鎖を残存させることにより、非限定的な様式で例示され、所望であれば、残った鎖を別の相手とのハイブリダイゼーションを達成するために使用することができる;
ことからなる前記方法。
2. The method of claim 1 for making a mutated progeny polynucleotide, said step (a) comprising subjecting the set of starting or parent polynucleotides to an exonuclease-mediated reassembly process in vitro. Producing a set of progeny polynucleotides)
(I) treating the set of starting or parent polynucleotides with a 3 'exonuclease that acts on 3' underhangs and blunt ends to release nucleotides at the 3 'end instead of the 5'end;
This allows the 3 'exonuclease to be treated with an exonuclease (e.g., exonuclease III) to release the nucleotide at the 3' end rather than the 5 'end from the starting double-stranded polynucleotide, partially or completely, Illustrated in a non-limiting manner, by leaving the remaining strands free of the original partner, the remaining strands can be used to achieve hybridization with another partner, if desired. ;
The method comprising:
突然変異させた子孫ポリヌクレオチドを作製するための請求項1に記載の方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットを5’アンダーハングに作用する5’エキソヌクレアーゼで処理して、5’末端のヌクレオチドを遊離させる、
これにより、該5’エキソヌクレアーゼは、エキソヌクレアーゼ(例えば、レッドアルファ遺伝子産物)で処理し、出発二本鎖ポリヌクレオチドから5’末端のヌクレオチドを遊離させ、部分的もしくは完全にその元の相手を含まない残った鎖を残存させることにより、非限定的な様式で例示され、所望であれば、残った鎖を別の相手とのハイブリダイゼーションを達成するために使用することができる;
ことからなる前記方法。
2. The method of claim 1 for making a mutated progeny polynucleotide, said step (a) comprising subjecting the set of starting or parent polynucleotides to an exonuclease-mediated reassembly process in vitro. Producing a set of progeny polynucleotides)
(I) treating the set of starting or parent polynucleotides with a 5 'exonuclease that acts on a 5' underhang, releasing the 5 'terminal nucleotide;
Thereby, the 5 ′ exonuclease is treated with an exonuclease (eg, the red alpha gene product) to release the 5 ′ terminal nucleotide from the starting double-stranded polynucleotide and to partially or completely revert its original partner. The remaining strands, which are not included, are exemplified in a non-limiting manner by remaining the remaining strands, which can be used, if desired, to achieve hybridization with another partner;
The method comprising:
突然変異させた子孫ポリヌクレオチドを作製するための請求項1に記載の方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットをエキソヌクレアーゼ処理に付すことにより、核酸のオーバーハングから末端のヌクレオチドを遊離させる、
これにより、該処理は、ハイブリダイズしていない末端等のオーバーハング末端に作用するエキソヌクレアーゼで処理(例えば、Mung Bean NucleaseまたはS1ヌクレアーゼまたは大腸菌DNAポリメラーゼを用いて処理)することにより、ヘテロ核酸複合体中のアニーリングさせた核酸鎖のハイブリダイズしていない一本鎖末端からヌクレオチドを遊離させ、短くされているがハイブリダイズした末端を残存させることにより処理末端のポリメラーゼに基づく伸長および/またはリガーゼ仲介型連結を促進する、ことにより非限定的な様式で例示される;
ことからなる前記方法。
2. The method of claim 1 for making a mutated progeny polynucleotide, said step (a) comprising subjecting the set of starting or parent polynucleotides to an exonuclease-mediated reassembly process in vitro. Producing a set of progeny polynucleotides)
(I) subjecting the set of starting or parent polynucleotides to exonuclease treatment to release terminal nucleotides from the nucleic acid overhang;
Thus, the treatment can be performed by treating with an exonuclease that acts on an overhanging end such as an unhybridized end (for example, by using Mung Bean Nuclease or S1 nuclease or Escherichia coli DNA polymerase) to obtain a heteronucleic acid complex. Polymerase-based extension and / or ligase mediation of the treated ends by releasing nucleotides from the unhybridized single-stranded ends of the annealed nucleic acid strands in the body and leaving shortened but hybridized ends Exemplified in a non-limiting manner by facilitating mold ligation;
The method comprising:
突然変異させた子孫ポリヌクレオチドを作製するための請求項1に記載の方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットを3’アンダーハングおよび平滑末端に作用する3’エキソヌクレアーゼ処理に付すことにより、5’末端ではなく3’末端のヌクレオチドを遊離させること、および
(ii) 出発または親ポリヌクレオチドのセットをエキソヌクレアーゼ処理に付すことにより、核酸のオーバーハングから末端のヌクレオチドを遊離させること、からなり、
これにより、前記エキソヌクレアーゼ仲介再集合プロセスが、例えば、アンダーハング末端もしくは平滑末端から末端ヌクレオチドを遊離させるエキソヌクレアーゼおよびハイブリダイズしていない末端等のオーバーハングから末端ヌクレオチドを遊離させるエキソヌクレアーゼの両方を同時ではなく用いることにより実施することができる二重処理である、前記方法。
2. The method of claim 1 for making a mutated progeny polynucleotide, said step (a) comprising subjecting the set of starting or parent polynucleotides to an exonuclease-mediated reassembly process in vitro. Producing a set of progeny polynucleotides)
(I) subjecting the set of starting or parent polynucleotides to a 3 'exonuclease treatment that acts on 3' underhangs and blunt ends to release nucleotides at the 3 'end instead of the 5'end; and (ii) Subjecting the set of starting or parent polynucleotides to exonuclease treatment to release terminal nucleotides from the nucleic acid overhang;
This allows the exonuclease-mediated reassembly process to remove both exonucleases that release terminal nucleotides from underhanging or blunt ends, and exonucleases that release terminal nucleotides from overhangs such as unhybridized ends. Such a method, wherein the method is a dual process that can be performed by using it rather than simultaneously.
突然変異させた子孫ポリヌクレオチドを作製するための請求項1に記載の方法であって、前記工程(a)(出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること)が、
(i) 出発または親ポリヌクレオチドのセットを5’アンダーハングに作用する5’エキソヌクレアーゼで処理して、5’末端のヌクレオチドを遊離させること、および
(ii) 出発または親ポリヌクレオチドのセットをエキソヌクレアーゼで処理して、核酸のオーバーハングから末端のヌクレオチドを遊離させること、
からなり、
これにより前記エキソヌクレアーゼ仲介再集合プロセスが、例えば、アンダーハング末端もしくは平滑末端から末端ヌクレオチドを遊離させるエキソヌクレアーゼおよびハイブリダイズしていない末端等のオーバーハングから末端ヌクレオチドを遊離させるエキソヌクレアーゼの両方を同時ではなく用いることにより実施することができる二重処理である、前記方法。
2. The method of claim 1 for making a mutated progeny polynucleotide, said step (a) comprising subjecting the set of starting or parent polynucleotides to an exonuclease-mediated reassembly process in vitro. Producing a set of progeny polynucleotides)
(I) treating the set of starting or parent polynucleotides with a 5 'exonuclease that acts on a 5' underhang to release the nucleotide at the 5 'end; and (ii) exposing the set of starting or parent polynucleotides to exo Treating with nucleases to release terminal nucleotides from the nucleic acid overhangs;
Consisting of
This allows the exonuclease-mediated reassembly process to simultaneously co-localize both exonucleases that release terminal nucleotides from underhang or blunt ends and exonucleases that release terminal nucleotides from overhangs such as unhybridized ends. Rather, it is a dual process that can be carried out by using.
少なくとも1つの所望の特性を有する突然変異させた子孫ポリヌクレオチドを作製するための方法であって、
(a) 出発または親ポリヌクレオチドのセットをin vitroでエキソヌクレアーゼ仲介再集合プロセスに付すことにより、子孫ポリヌクレオチドのセットを作製すること、ならびに
(b) 子孫ポリヌクレオチドのセットを末端選択に基づくスクリーニングおよび富化プロセスに付すことにより、子孫ポリヌクレオチドの所望のサブセットを選択すること、
からなる前記方法であって、
これにより、上記工程は反復して、またどんな順序、組合わせで行うこともでき;
これにより、末端選択に基づくプロセスにより連結に適合する末端を作製し;
これにより、集合および/または再集合的突然変異誘発を達成するために、任意で連結に適合する末端の作製を利用して子孫ポリヌクレオチドのセットのメンバー内での1以上の分子間連結(好ましくは定方向の連結)を促進し、;
これにより、連結に適合する末端作製は子孫ポリヌクレオチドのセットの発現ベクター系への連結および発現クローニングを促進するのに役立ち、;
これにより、前記子孫ポリヌクレオチドのセットの発現クローニングはポリペプチドのセットを生成させるのに役立ち、;
これにより、生成されたポリペプチドのセットを発現スクリーニングプロセスに付すことができ、;そして
これにより、子孫ポリペプチドのセットの発現スクリーニングは、所望の特性(例えば、特異的酵素活性)を有する所望の分子種(例えば、突然変異ポリペプチドまたはポリペプチド断片)を同定する手段を提供する。
A method for producing a mutated progeny polynucleotide having at least one desired property, comprising:
(A) generating a set of progeny polynucleotides by subjecting the set of starting or parent polynucleotides to an exonuclease-mediated reassembly process in vitro; and (b) screening the set of progeny polynucleotides based on end selection. Selecting a desired subset of progeny polynucleotides by subjecting them to an enrichment process.
The method comprising:
Thereby, the above steps can be performed iteratively and in any order and combination;
This makes the ends compatible for ligation by a process based on end selection;
This allows one or more intermolecular linkages (preferably, within members of a set of progeny polynucleotides to be made, optionally using the creation of ligation compatible ends to achieve assembly and / or reassembly mutagenesis). Promotes a directional connection);
This makes the ligation compatible end creation help facilitate ligation and expression cloning of the set of progeny polynucleotides into an expression vector system;
Thereby, expression cloning of said set of progeny polynucleotides serves to generate a set of polypeptides;
This allows the resulting set of polypeptides to be subjected to an expression screening process; and, thereby, expression screening of the set of progeny polypeptides results in the desired properties (eg, specific enzymatic activities) having the desired properties. A means is provided for identifying a molecular species (eg, a mutant polypeptide or polypeptide fragment).
先祖ポリヌクレオチドのコレクションから突然変異させた子孫ポリヌクレオチドを生成する方法であって、
(a) 1本の多結合核酸鎖を2本の単一結合核酸鎖にアニーリングすることにより、アニーリングさせた核酸鎖ヘテロ複合体を生成すること、
ここで1本の多結合核酸鎖および2本の単一結合核酸鎖は、それぞれ前記先祖ポリヌクレオチドのコレクション中の異なる分子種に由来するものであり、;
ここで前記先祖ポリヌクレオチドのコレクションは、好ましくは、デハロゲナーゼをコードする遺伝子のコレクションにより例示されるような、同一ではないが関連する可能性のある複数の子孫ポリヌクレオチドからなり、;
ここで1本の多結合核酸鎖および2本の単一結合核酸鎖は、それぞれそれらが由来する先祖ポリヌクレオチドと同一の、少なくとも7ヌクレオチド長の配列を有し、;
(b) 前記へテロ複合体中のアニーリングさせた単一結合核酸鎖のハイブリダイズしていない一本鎖末端をエキソヌクレアーゼ処理に付すことにより、そのハイブリダイズしていない一本鎖末端を分解すること、
これにより、同一ではないポリヌクレオチドに由来する実施多結合鎖および単一結合鎖のアニールメントにより、その後に前記の同一ではないポリヌクレオチドのキメラ化を生じさせることが可能となり、;
これにより、前記のアニーリングさせた核酸鎖複合体のライブラリー中で、多くの成分鎖はポリメラーゼに基づく伸長をプライミングするには至適でないまたは役に立たない、ハイブリダイズすることができない末端を有し、;そして
これにより、エキソヌクレーゼ処理によりそうしたハイブリダイズできない末端を除去し、アニーリングさせた核酸鎖複合体をポリメラーゼに基づく伸長により適したプライマーに変換する;
ことを含んでなる前記方法。
A method of producing a mutated progeny polynucleotide from a collection of ancestral polynucleotides,
(A) annealing one multi-attached nucleic acid strand to two single-attached nucleic acid strands to form an annealed nucleic acid strand heterocomplex;
Wherein one multi-attached nucleic acid strand and two single-attached nucleic acid strands are each derived from different molecular species in said ancestral polynucleotide collection;
Wherein said collection of ancestral polynucleotides preferably comprises a plurality of non-identical but potentially related progeny polynucleotides, as exemplified by the collection of genes encoding dehalogenases;
Wherein one multi-attached nucleic acid strand and two single-attached nucleic acid strands each have a sequence at least 7 nucleotides in length, identical to the ancestral polynucleotide from which they are derived;
(B) subjecting the non-hybridized single-stranded end of the annealed single-bonded nucleic acid strand in the hetero complex to exonuclease treatment to decompose the non-hybridized single-stranded end; thing,
This allows annealing of the working multi- and single-binding strands derived from the non-identical polynucleotides to subsequently cause chimerization of said non-identical polynucleotides;
Thus, in the library of annealed nucleic acid strand complexes, many component strands have non-hybridizable ends that are not optimal or useless for priming polymerase-based extension; And thereby removing such non-hybridizable ends by exonuclease treatment and converting the annealed nucleic acid strand complex to a more suitable primer for polymerase-based extension;
The method comprising:
請求項8に記載の方法であって、下記ステップ(c):
(c) アニーリングさせたヘテロ複合体をポリメラーゼに基づく伸長に付す、
ことをさらに含んでなる、前記方法。
9. The method according to claim 8, wherein the following step (c):
(C) subjecting the annealed heterocomplex to polymerase-based extension;
The above method, further comprising:
請求項9に記載の方法であって、下記ステップ(d):
(d) アニーリングさせた核酸鎖をリガーゼ処理に付す、
これにより、リガーゼ処理は、2本のアニーリングさせた単一結合鎖間の分子間連結を達成してそれにより共有結合により連結されたキメラ化鎖を形成するために、T4 DNAリガーゼ処理に付すことにより例示される;
ことをさらに含んでなる、前記方法。
The method according to claim 9, wherein the following step (d):
(D) subjecting the annealed nucleic acid strand to a ligase treatment;
Thus, the ligase treatment is subject to T4 DNA ligase treatment to achieve intermolecular ligation between the two annealed single binding strands, thereby forming a covalently linked chimerized strand. Exemplified by:
The above method, further comprising:
請求項10に記載の方法であって、下記ステップ(e):
(e) 連結した単一結合核酸鎖から多結合核酸鎖を分離する、
これにより、多結合核酸鎖がアニーリングした連結した単一結合核酸鎖からの該多結合核酸鎖の分離は、例えば、変性または多結合核酸鎖に選択的に作用する酵素活性への暴露のいずれかによって達成することができる;
ことをさらに含んでなる、前記方法。
11. The method according to claim 10, comprising the following step (e):
(E) separating the multi-linked nucleic acid strand from the linked single-linked nucleic acid strand;
Thereby, separation of the multi-attached nucleic acid strand from the linked single-attached nucleic acid strand to which the multi-attached nucleic acid strand has been annealed can be, for example, either by denaturation or exposure to an enzymatic activity that acts selectively on the multi-attached nucleic acid strand Can be achieved by:
The above method, further comprising:
請求項11に記載の方法であって、下記ステップ(f):
(f) 連結された単一結合核酸鎖に相補的な核酸鎖を生成する、
これにより、得られる産物は二本鎖の突然変異させた子孫ポリヌクレオチドからなる;
をさらに含んでなる、前記方法。
The method according to claim 11, comprising the following step (f):
(F) producing a nucleic acid strand complementary to the linked single binding nucleic acid strand;
Thereby, the resulting product consists of a double-stranded mutated progeny polynucleotide;
The above method, further comprising:
請求項1〜12のいずれか1項に記載の方法であって、突然変異させた子孫ポリヌクレオチドが遺伝子または遺伝子経路である、前記方法。13. The method of any one of claims 1 to 12, wherein the mutated progeny polynucleotide is a gene or a gene pathway. 請求項13に記載の方法であって、生成された突然変異させた子孫ポリヌクレオチドを適切な宿主中で発現させることをさらに含み、ここで前記発現が発現スクリーニングにより検出され得るポリペプチド産物の生成をもたらすものである、前記方法。14. The method of claim 13, further comprising expressing the generated mutated progeny polynucleotide in a suitable host, wherein the expression is detected by expression screening to produce a polypeptide product. The method described above.
JP2000608795A 1999-03-26 2000-03-27 Exonuclease-mediated nucleic acid reassembly in directed evolution Pending JP2004500019A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/276,860 US6352842B1 (en) 1995-12-07 1999-03-26 Exonucease-mediated gene assembly in directed evolution
US09/332,835 US6537776B1 (en) 1999-06-14 1999-06-14 Synthetic ligation reassembly in directed evolution
PCT/US2000/008245 WO2000058517A1 (en) 1999-03-26 2000-03-27 Exonuclease-mediated nucleic acid reassembly in directed evolution

Publications (1)

Publication Number Publication Date
JP2004500019A true JP2004500019A (en) 2004-01-08

Family

ID=26958167

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000608795A Pending JP2004500019A (en) 1999-03-26 2000-03-27 Exonuclease-mediated nucleic acid reassembly in directed evolution

Country Status (6)

Country Link
EP (1) EP1092041A4 (en)
JP (1) JP2004500019A (en)
AU (1) AU4039400A (en)
CA (1) CA2329122A1 (en)
MX (1) MXPA00011569A (en)
WO (1) WO2000058517A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012519499A (en) * 2009-03-09 2012-08-30 バイオアトラ、エルエルシー MIRAC protein

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6936289B2 (en) 1995-06-07 2005-08-30 Danisco A/S Method of improving the properties of a flour dough, a flour dough improving composition and improved food products
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US6991922B2 (en) 1998-08-12 2006-01-31 Proteus S.A. Process for in vitro creation of recombinant polynucleotide sequences by oriented ligation
US6951719B1 (en) 1999-08-11 2005-10-04 Proteus S.A. Process for obtaining recombined nucleotide sequences in vitro, libraries of sequences and sequences thus obtained
CA2345203A1 (en) 1998-10-07 2000-04-13 Maxygen Inc. Dna shuffling to produce nucleic acids for mycotoxin detoxification
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
MXPA00009723A (en) * 1999-02-04 2003-09-22 Diversa Corp Non-stochastic generation of genetic vaccines and enzymes.
US6531316B1 (en) 1999-03-05 2003-03-11 Maxyag, Inc. Encryption of traits using split gene sequences and engineered genetic elements
DE19953854C2 (en) * 1999-11-09 2002-01-17 Max Planck Gesellschaft Process for the production of biopolymers with modified properties
US6686515B1 (en) 1999-11-23 2004-02-03 Maxygen, Inc. Homologous recombination in plants
US6479262B1 (en) 2000-05-16 2002-11-12 Hercules, Incorporated Solid phase enzymatic assembly of polynucleotides
US6858422B2 (en) 2000-07-13 2005-02-22 Codexis, Inc. Lipase genes
EP1507870A4 (en) * 2000-12-01 2005-11-09 Diversa Corp Enzymes having dehalogenase activity and methods of use thereof
WO2002059297A2 (en) 2001-01-25 2002-08-01 Evolva Biotech A/S A library of a collection of cells
US8008459B2 (en) 2001-01-25 2011-08-30 Evolva Sa Concatemers of differentially expressed multiple genes
BR0209154A (en) 2001-05-18 2004-07-20 Danisco Process of preparing a dough with an enzyme
EP1840211A1 (en) 2001-10-31 2007-10-03 Danisco A/S Pyranosone dehydratase from phanerochaete chrysosporium
ATE506440T1 (en) 2003-01-17 2011-05-15 Danisco METHOD FOR PRODUCING A HYDROXY ACID ESTER
WO2005066347A1 (en) 2003-12-24 2005-07-21 Danisco A/S Proteins
DK1776455T3 (en) 2004-07-16 2015-06-22 Dupont Nutrition Biosci Aps LIPOLYTIC ENZYM, APPLICATIONS THEREOF IN THE FOOD INDUSTRY
GB0421598D0 (en) 2004-09-29 2004-10-27 Cambridge Advanced Tech Modification of plant development and morphology
GB0422052D0 (en) 2004-10-04 2004-11-03 Dansico As Enzymes
GB0423139D0 (en) 2004-10-18 2004-11-17 Danisco Enzymes
GB0500417D0 (en) 2005-01-10 2005-02-16 Cambridge Antibody Tech Method of mutagenesis
DE602006013596D1 (en) * 2005-01-10 2010-05-27 Medimmune Ltd Cambridge mutagenesis
BRPI0720801A2 (en) 2007-01-25 2014-09-16 Dupont Nutrition Biosci Aps Production of an acyltransferase lipid from transformed cells of Bacillus licheniformis.
US8143046B2 (en) 2007-02-07 2012-03-27 Danisco Us Inc., Genencor Division Variant Buttiauxella sp. phytases having altered properties
US9476032B2 (en) 2007-03-30 2016-10-25 The Research Foundation For The State University Of New York Attenuated viruses useful for vaccines
EA020035B1 (en) 2007-12-21 2014-08-29 ДюПон НЬЮТРИШН БАЙОСАЙЕНСИЗ АпС Processes
GB0908770D0 (en) 2009-04-24 2009-07-01 Danisco Method
EP2432876A1 (en) 2009-05-19 2012-03-28 Danisco A/S Use
AR077042A1 (en) 2009-06-12 2011-07-27 Danisco METHOD TO TREAT A COMPOSITION CONTAINING PYROPHIOPHYTIN
GB0920089D0 (en) 2009-11-17 2009-12-30 Danisco Method
WO2011110967A1 (en) 2010-03-12 2011-09-15 Danisco A/S Process
WO2011114251A1 (en) 2010-03-18 2011-09-22 Danisco A/S Foodstuff
AR081950A1 (en) 2010-06-17 2012-10-31 Danisco SEED TREATMENT PROCESS CONTAINING OIL
GB201011513D0 (en) 2010-07-08 2010-08-25 Danisco Method
CA2825628A1 (en) 2011-02-23 2012-08-30 Dupont Nutrition Biosciences Aps Method
WO2012114232A1 (en) 2011-02-23 2012-08-30 Dupont Nutrition Biosciences Aps Process
ES2649912T3 (en) 2011-02-23 2018-01-16 Dupont Nutrition Biosciences Aps Enzymatic treatment of chlorophyll in vegetable oils
RU2013149861A (en) 2011-04-08 2015-05-20 ДАНИСКО ЮЭс, ИНК. COMPOSITIONS
WO2013104659A2 (en) 2012-01-13 2013-07-18 Dupont Nutrition Biosciences Aps Process
WO2013104660A1 (en) 2012-01-13 2013-07-18 Dupont Nutrition Biosciences Aps Process for treating a plant oil comprising hydrolysing chlorophyll or a chlorophyll derivative and involving partial caustic neutralisation
WO2013160374A1 (en) 2012-04-27 2013-10-31 Dupont Nutrition Biosciences Aps Process for refining crude plant oil involving enzymatic hydrolysis and gum recycling
WO2013160372A1 (en) 2012-04-27 2013-10-31 Dupont Nutrition Biosciences Aps Process for treating plant oil involving addition of serial doses of chlorophyll or chlorophyll derivative degrading enzyme
EP2909230B1 (en) 2012-10-19 2019-05-22 Danisco US Inc. Stabilization of biomimetic membranes
DK3083936T3 (en) 2013-12-19 2018-10-22 Danisco Us Inc USE OF HYDROPHOBINES TO INCREASE GAS TRANSFER IN AEROBE FERMENTATION PROCESSES
WO2015150372A1 (en) 2014-04-01 2015-10-08 Dupont Nutrition Biosciences Aps Method for increasing crude palm oil yields
BR112017007949A2 (en) 2014-10-24 2018-01-23 Danisco Us Inc method for alcohol production by the use of a tripeptidyl peptidase
EP3209773B1 (en) 2014-10-24 2020-03-18 DuPont Nutrition Biosciences ApS Proline tolerant tripeptidyl peptidases and uses thereof
MX2018009216A (en) 2016-02-25 2018-11-09 Dupont Nutrition Biosci Aps Method for producing a protein hydrolysate employing an aspergillus fumigatus tripeptidyl peptidase.
EP3491128B1 (en) * 2016-07-29 2021-09-08 New England Biolabs, Inc. Methods and compositions for preventing concatemerization during template- switching

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0316018A3 (en) * 1985-03-29 1989-07-26 Cetus Oncology Corporation Modification of dna sequences
US4959312A (en) * 1985-05-31 1990-09-25 The University Of Tennessee Research Corporation Full spectrum mutagenesis
JP3096722B2 (en) * 1990-01-17 2000-10-10 日本ケミカルリサーチ株式会社 Method for preparing primer for polymerase chain reaction and method for amplifying DNA using the same
WO1991012341A1 (en) * 1990-02-12 1991-08-22 Fred Hutchinson Cancer Research Center Improved method for ordered deletions from a fixed point in a cloned insert
US6117679A (en) * 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5965408A (en) * 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
WO1997020918A1 (en) * 1995-12-07 1997-06-12 Recombinant Biocatalysis, Inc. Method of screening for enzyme activity
US5830696A (en) * 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US5789166A (en) * 1995-12-08 1998-08-04 Stratagene Circular site-directed mutagenesis
IL120338A0 (en) * 1997-02-27 1997-06-10 Gesher Israel Advanced Biotecs Single step DNA fragments assembly
GB9712512D0 (en) * 1997-06-16 1997-08-20 Bioinvent Int Ab A method for in vitro molecular evolution of protein function

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012519499A (en) * 2009-03-09 2012-08-30 バイオアトラ、エルエルシー MIRAC protein
US9464284B2 (en) 2009-03-09 2016-10-11 Bioatla, Llc Mirac proteins
US9637734B2 (en) 2009-03-09 2017-05-02 Bioatla, Llc Mirac proteins
US9637735B2 (en) 2009-03-09 2017-05-02 Bioatla, Llc Mirac proteins
US9982252B2 (en) 2009-03-09 2018-05-29 Bioatla, Llc Mirac proteins
US9994841B2 (en) 2009-03-09 2018-06-12 Bioatla, Llc Mirac proteins
US11718844B2 (en) 2009-03-09 2023-08-08 Bioatla, Inc. Mirac proteins

Also Published As

Publication number Publication date
CA2329122A1 (en) 2000-10-05
MXPA00011569A (en) 2004-12-03
EP1092041A4 (en) 2001-09-19
AU4039400A (en) 2000-10-16
EP1092041A1 (en) 2001-04-18
WO2000058517A1 (en) 2000-10-05

Similar Documents

Publication Publication Date Title
CA2374667C (en) Synthetic ligation reassembly in directed evolution
US6358709B1 (en) End selection in directed evolution
US6773900B2 (en) End selection in directed evolution
US6361974B1 (en) Exonuclease-mediated nucleic acid reassembly in directed evolution
JP2004500019A (en) Exonuclease-mediated nucleic acid reassembly in directed evolution
US6709841B2 (en) Exonuclease-mediated gene assembly in directed evolution
US6238884B1 (en) End selection in directed evolution
WO2000053744A9 (en) End selection in directed evolution
US6939689B2 (en) Exonuclease-mediated nucleic acid reassembly in directed evolution
AU2009212959B2 (en) Synthetic ligation reassembly in directed evolution
AU2005203018A1 (en) Exonuclease-mediated nucleic acid reassembly in directed evolution
Class et al. Patent application title: SYNTHETIC LIGATION REASSEMBLY IN DIRECTED EVOLUTION Inventors: Jay M. Short (Del Mar, CA, US)
AU2005203719A1 (en) End selection in directed evolution

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050405

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20050629

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20050719

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051213