JP2006519594A

JP2006519594A - 所定のタンパク質ファミリー用に最適化したｓｉＲＮＡライブラリー

Info

Publication number: JP2006519594A
Application number: JP2006503475A
Authority: JP
Inventors: ヘンリーリー; ジョンイーチャタートン; ウーファンファン; ニンケ; スタールフロッシーウォン
Original assignee: イミューソルインコーポレイテッド
Priority date: 2003-02-11
Filing date: 2004-02-10
Publication date: 2006-08-31
Also published as: AU2004210972A1; EP1606300A4; WO2004072261A2; US20050026172A1; WO2004072261A3; CA2515688A1; EP1606300A2

Abstract

小さい阻害性RNA(siRNA)を生成するためのライブラリーであって、該ライブラリーのメンバーが、所定のタンパク質ファミリーをコードする遺伝子の発現を阻害するように最適化されているライブラリーを提供する。このライブラリーのメンバーは、少なくとも、前記タンパク質ファミリーのすべてのメンバーをコードするmRNAを標的にする。本発明のsiRNAライブラリーの製造方法をも提供する。

Description

本発明は、siRNA発現ライブラリーに関する。

（発明の背景）
小さい干渉性RNAs(siRNA)は、RNA干渉(RNAi)、配列特異的遺伝子サイレンシングの一形態として知られる過程を誘導する短い二本鎖RNA断片である。Zamore, Phillipら, Cell 101:25-33 (2000); Elbashir, Sayda M.ら, Nature 411:494-497 (2001)。siRNAはRNA-誘導性サイレンシング複合体(RNA-induced silencing complex)(RISC)として知られる多成分複合体に構築される。siRNAはRISCを相同性mRNAsに導き、それらを破壊の標的にする。Hammondら, Nature Genetics Reviews 2:110-119 (2000)。RNAiは植物、昆虫及び哺乳類を含む種々の生物内で観察されている。RNAiは、遺伝子のmRNAの急速な破壊を引き起こすことによって該遺伝子の発現を特異的に阻害するための手段を与えるので、現在、RNAiを治療ツールとして、すなわち種々の疾病過程に関与することが分かっている特定の遺伝子標的にし、かつ選択的にサイレンシングする手段として使用可能かどうかを確認するために多くの研究が行われている。RNAiは、機能性ゲノムの分野で研究ツールとして、すなわち種々の疾病過程に関与する、今までは未知であった遺伝子を同定かつ発見し、本出願の譲受人によって開発されたInverse Genomics(登録商標)のような遺伝子発見法(例えば、WO 00/05415参照)を利用するための手段としても使用される。

siRNAのライブラリーを発現可能な発現カセットの製造については種々の方法が知られている。本出願の譲受人に譲渡されている同時係属出願(米国特許出願番号10/628,587及び10/626,512)には、すべて又は大部分のsiRNAヌクレオチド配列が完全にランダム化されているsiRNAの発現方法が記載されている。21ヌクレオチドの長さを有するsiRNAについて、完全ランダムsiRNAライブラリーは(4²¹)/2すなわち2.2ｘ10¹²個の固有(unique)メンバー（構成員）を含む。このような大きさ(“複雑度”)のライブラリーは、Inverse Genomics(登録商標)の方法を利用する遺伝子発見の目的で非常に有用であるが、このような複雑度のライブラリーの使用に本来的に内在する、ある実用上の欠点がある。ある環境下では、このような複雑度のライブラリーの使用は必要ではなく、生産性に反しさえする。例えば、タンパク質ファミリーをコードすることが分かっている少数の遺伝子についてRNAiの効果を研究したい場合、完全な複雑度を有する全体的にランダム化したライブラリーよりもむしろこれら遺伝子をサイレンシングするsiRNAだけを含む限定した(低複雑度)ライブラリーを発現させることが好ましいだろう。今まで、そうすることは不可能であり、かつ唯一の代替手段は、問題のsiRNAをそれぞれ別個にかつすべて合成することだった。

本発明者らは、問題の特定遺伝子、例えば所定のタンパク質ファミリーをコードする遺伝子を機能的にサイレンシングする少なくともすべてのsiRNAを含むように最適化されているsiRNAのライブラリーの発現方法を発見した。この新規な方法は、当該技術で現在既知又は実用されている他の方法を越えて非常に有利である。本方法は、単工程で注目するsiRNAの標的化ライブラリー全体の分子クローニングを可能とするので、個々のsiRNAの合成に係るかなり高いコストと時間消費を排除する。本方法は、プール化構成のsiRNAの送達をも可能とするので、高価なロボットベースの高処理能力スクリーニング法を必要とせずにコンビナトリアルスクリーニングを可能にする。さらに、本方法は、問題のライブラリーの設計及び発現において高度の柔軟性を与えるので、研究の目標及び問題の遺伝子又はタンパク質ファミリーについて利用できる情報に基づいて、該ライブラリーの複雑度を容易に変更（すなわち、その大きさを増減）するこが可能である。最後に、本発明のsiRNAライブラリーは部分的にランダム化した遺伝子配列によって発現されるので、それらは、問題のタンパク質ファミリーのすべての既知メンバーをコードする遺伝子をサイレンシングする能力を有するsiRNAのみならず、追加の遺伝子をもサイレンシングする能力を有するsiRNAも含むので、問題のファミリーに属するタンパク質を発現することが今までは知られていなかった新規遺伝子の発見（Inverse Genomics(登録商標)のような方法によって）の確率を拡大する。

（発明の簡単な概要）
本発明は、タンパク質ファミリーをコードする遺伝子の選択的な転写後サイレンシング用のsiRNA発現ライブラリーを提供する。該ライブラリーのメンバーは、15〜30ヌクレオチド長の、かつ少なくとも該タンパク質ファミリーのすべての既知メンバーをコードする全mRNAを標的にするsiRNA分子をコードする。本ライブラリーは、50〜100万個の固有メンバーを含みうる。好ましい実施形態では、siRNA分子は18〜24ヌクレオチド長である。なお別の好ましい実施形態では、タンパク質ファミリーは、Ｇタンパク質共役受容体、イオンチャンネル、受容体チロシンキナーゼ、非受容体チロシンキナーゼ、核ホルモン受容体、GTPアーゼ、ATPアーゼ、セリン／スレオニンキナーゼ、プロテアーゼ、マトリックスメタロプロテイナーゼ(MMP)、GTPアーゼ活性化タンパク質(GAP)、E3ユビキチンリガーゼ等のような疾病過程に関与することが分かっているいずれかである。
本発明は、タンパク質ファミリーをコードする遺伝子の選択的な転写後サイレンシング用のsiRNA発現ライブラリーの生成方法をも提供する。本方法は、タンパク質ファミリーのコンセンサス配列を同定する工程と、siRNA発現ライブラリーであって、そのメンバーが少なくとも該タンパク質ファミリーのすべての既知メンバーをコードする全mRNAsを標的にするsiRNA分子をコードするsiRNA発現ライブラリーを生成する工程を含む。コンセンサス配列は15〜30個のヌクレオチド、好ましくは18〜24個のヌクレオチドを含みうる。一実施形態では、タンパク質ファミリーについて少なくとも１つのシグネチャーモチーフの同定後にコンセンサス配列を決定する。別の実施形態では、タンパク質ファミリーについてシグネチャーモチーフの２以上の変種を同定し、該変種のそれぞれについてコンセンサス配列を決定する。

（定義）
用語“核酸”又は“ポリヌクレオチド”は、単鎖又は二本鎖形態のデオキシリボ核酸(DNA)又はリボ核酸(RNA)及びそのポリマーを意味する。特に限定しない限り、本用語は、言及した核酸と同様の結合特性を有し、かつ天然に存在するヌクレオチドと同じ様式で代謝される天然ヌクレオチドの既知類似体を含有する核酸を包含する。特に示さない限り、特定の核酸配列は、明示的に指定した配列のみならず、暗黙にその保存的に変化した変異体(例えば、縮重コドン置換)、アレル、オルトログ(orthologs)、SNPs、及び相補配列を包含する。具体的には、縮重コドン置換は、１個以上の選択した(又はすべての)コドンの第３位が混合塩基及び／又はデオキシイノシン残基で置換されている配列を生成することによって達成しうる(Batzerら, Nucleic Acid Res. 19:5081 (1991); Ohtsukaら, J. Biol. Chem. 260:2605-2608 (1985);及びRossoliniら, Mol. Cell. Probes 8:91-98 (1994))。核酸なる用語は、遺伝子、cDNA、及び遺伝子によってコードされるmRNAと互換的に使用される。

用語“遺伝子”又は“細胞性遺伝子”は、特有の転写産物をコードする核酸断片を意味し；それは転写発現を制御するコーディング領域に先行する領域(５'非コーディング)とコーディング領域の後の領域(３'二コーディング)並びに個々のコーディングセグメント(エキソン)間の介在配列(イントロン)を包含する。
用語“dsRNA”又は二本鎖RNAは、二本鎖コンホメーション内に塩基対合相互作用を介して２個のハイブリダイズした相補RNA鎖を含むRNA分子を意味する。用語“siRNA”は、好ましくは15〜30、さらに好ましくは18〜24塩基対長のdsRNAを指し、各鎖は短い３'オーバーハングを有しうる。機能的に、dsRNAの他の形態に対するsiRNAの特徴的な区別は、siRNAが“RNA干渉”(RNAi)と呼ばれる過程によって遺伝子の発現を特異的に阻害できること、及びその小さいサイズのため、哺乳類細胞内で、遺伝子発現の非特異的阻害をもたらしうるインターフェロン及びPKR経路を誘導しないことである。

“ライブラリー”は、本明細書では共通の特性を有する核酸配列の集団を意味する。例えば、核酸のライブラリーは、定義した長さにわたって可能なすべての配置の核酸配列を表現しうる。あるいは、核酸ライブラリーは、定義した長さの可能な配列の配置の特定サブセットを表す配列の集団でありうる。ライブラリーは、ある生物の遺伝情報のすべて又は一部を表すこともある。核酸“ライブラリー”は、典型的には、しかし必ずしもではないが、ベクターにクローン化される。
本発明の“siRNA発現ライブラリー”は、転写過程によってsiRNA分子の集団を生成しうる核酸ライブラリーである。
“ポリペプチド”、“ペプチド”、及び“タンパク質”は、本明細書では互換的に使用され、アミノ酸残基のポリマーを指す。３つのすべての用語は、天然に存在するアミノ酸ポリマー及び非天然アミノ酸ポリマーのみならず、１個以上のアミノ酸残基が対応する天然アミノ酸の人工的な化学的模倣物であるアミノ酸ポリマーにも適用する。本明細書では、これら用語は、全長タンパク質を含め、アミノ酸残基が共有ペプチド結合によって連結しているいずれの長さのアミノ酸鎖をも包含する。

本明細書では、“タンパク質ファミリー”は、同一又は関連生化学機能を果たす２個以上のタンパク質を指す。タンパク質ファミリーのメンバーは、通常該ファミリーの機能特性に関連する少なくとも１つの保存ドメイン内で実質的レベルのアミノ酸配列相同性を示す。“遺伝子ファミリー”はタンパク質ファミリーをコードする遺伝子からなる。
本明細書では、“シグネチャーモチーフ(signature motif)”はタンパク質ファミリーのメンバーに特徴的なアミノ酸配列を指し、かつ通常、該タンパク質ファミリーの生物学的機能にとって重要な高度に保存されたドメイン内で見られる。シグネチャーモチーフの長さは、好ましくは５〜10、さらに好ましくは６〜８個のアミノ酸である。シグネチャーモチーフのアミノ酸のうち、典型的には約50％、好ましくは約60％以上が該ファミリーの全メンバー内で不変であり、そのバランスは可変である。あるタンパク質ファミリーについて、本発明の実施は、シグネチャーモチーフの２個以上の変種を同定することを含み、ここで各変種は該ファミリーを構成するタンパク質の部分集団のアミノ酸配列を表す。

本明細書では、用語“コンセンサス配列”は、同じシグネチャーモチーフを共有するタンパク質ファミリーの少なくとも全メンバーのアミノ酸配列をコードする核酸配列の組を規定する。典型的には、該シグネチャーモチーフ自体内のアミノ酸配列の可変性と、コドン縮重の両方のため、シグネチャーモチーフのアミノ酸配列をコードする複数個のヌクレオチド配列がある。コンセンサス配列は、定常塩基及び可変塩基の両方を含む式で表される。可変塩基のうち、いくつかの塩基は“完全にランダム”(又は“ランダム”)、すなわち、４つの可能な塩基のいずれでもあり得る。他の塩基は、“部分的にランダム”、すなわち、それらは４つの可能な塩基の２つだけ、又は３つだけ所定塩基を含みうる。コンセンサス配列の長さはシグネチャーモチーフの長さに依存して変わりうる。典型的には、長さは15〜30ヌクレオチド、さらに多くの場合18〜24ヌクレオチドである。
本明細書では、アミノ酸は、IUPAC-IUB生化学命名委員会によって推奨される一般的に知られている３文字記号又は１文字記号で表すことができる。同様に、ヌクレオチドはそれらの一般的に承認されている単文字コードで表される。

本明細書では、用語“遺伝子発現”は、生物学的に活性な物質（事実上核酸（例えば、mRNA）又はタンパク質（例えば、酵素）であろう）を、該生物学的に活性な物質をコードする核酸から生産することに関与するすべての過程を指す。遺伝子発現は、成熟物質を生産するために必要なすべての転写後（例えば、RNAスプライシング）及び／又は翻訳後プロセシング（例えば、グリコシル化のような翻訳後修飾）を包含する。遺伝子発現は、転写、転写後、翻訳、及び翻訳後レベルでの妨害を含め、生物学的に活性な物質の生産につながる過程を妨害するいずれかの手段によって“サイレンシング”“阻害”又は“抑制”されうる。本発明の目的では、“転写後遺伝子サイレンシング”は、問題のタンパク質ファミリーに属するタンパク質をコードする遺伝子の発現を抑制するときの本発明によって生成されるsiRNAの効果を指す。
用語“センスsiRNA鎖”は、標的mRNA配列と合致するsiRNA鎖を指す。用語“アンチセンスsiRNA鎖”は、標的mRNA配列と相補的なsiRNAを言う。

（発明の詳細な説明）
１．序論
本発明は、所定のタンパク質ファミリーのすべてのメンバーをコードする遺伝子を機能的にサイレンシングするために十分な少なくともすべてのsiRNAを含むように最適化されているsiRNAのライブラリーを設計および発現させる新規な方法を提供する。本発明は、問題のsiRNAのライブラリー全体の分子クローニングを提供し、個々のsiRNAの合成に係る高コストを排除する。本方法はsiRNAの設計及び発現の高度な柔軟性をも与えるので、研究者の目的及び問題の遺伝子又はタンパク質ファミリーについて利用しうる情報に依存して、研究者は容易にライブラリーの複雑度を改変（すなわち、その大きさを増減）することができる。本発明は、ゲノム研究で特定の用途を有し、かつＧタンパク質共役受容体、イオンチャンネル、受容体チロシンキナーゼ、非受容体チロシンキナーゼ、核ホルモン受容体、GTPアーゼ、ATPアーゼ、セリン／スレオニンキナーゼ、プロテアーゼ、マトリックスメタロプロテイナーゼ(MMP)、GTPアーゼ活性化タンパク質(GAP)、及びE3ユビキチンリガーゼを含む疾病過程に関与することが分かっているか又は疑いのあるタンパク質の遺伝子コーディングの同定と確証に関して効率的に使用することができる。理論的観点からは本発明のライブラリーは大きさを限定する必要はないが、実用的考慮からは限定した複雑度のライブラリーを設計することが必要となる。典型的には、本発明によって設計かつ構築されるライブラリーは20,000〜100,000の構成員（メンバー）を含むが、50程度の少ないメンバー又は100万程度の多くのメンバーを有するライブラリーも本発明の範囲内に包含される。

II．シグネチャーモチーフの同定
本発明によるsiRNA発現ライブラリーの構築は、第１工程として問題のタンパク質ファミリーについて少なくとも１つの“シグネチャーモチーフ”を同定する工程を必要とする。各シグネチャーモチーフは該タンパク質ファミリーのメンバーに特徴的なアミノ酸配列であり、かつ通常該ファミリーのメンバーの生物学的機能にとって重要な高度に保存されたドメイン内に見られる。高度に保存されたドメイン及びシグネチャーモチーフは、アミノ酸及びヌクレオチド配列のアラインメントや該ファミリー内の配列相同性の分析を含む技術的に知られた種々の手段で同定しうる。A. D. Baxevanisら, Bioinformatics A Practical Guide to the Analysis of Genes and Proteins. 第２版(1998)。シグネチャーモチーフの同定においてこれを補助するための種々のツールも利用可能であり、CLUSTALW(Higgensら 1996)のようなソフトウェアが挙げられ、種々のデフォルトパラメーターで使用することができ、或いは必要に応じて変更しうる。シグネチャーモチーフは典型的には５〜10、さらに好ましくは６〜８アミノ酸長である。シグネチャー配列を構成するアミノ酸のうち、好ましくは約50％、さらに好ましくは60％以上が該タンパク質ファミリーのメンバー内で不変であり、そのバランスは可変である。

核ホルモン受容体ファミリーの代表的なシグネチャーモチーフを実施例１で示す。これは、このタンパク質ファミリーの45の既知メンバーのジンクフィンガー(Zinc Finger)_C4ドメイン内に位置するシグネチャーモチーフであり、アミノ酸配列：(T/S/A)-C-(D/E/G/N)-(G/S/A)-(C)-(K/S)-(A/G/S/V)を含み、該配列の第２番目及び第５番目のアミノ酸、Ｃ(システイン)は該ファミリーの全メンバー内で不変であり、バランスは可変である。残りのアミノ酸の変動の度合はこのシグネチャーモチーフ全体で等しくないことは理解されよう。従って、第１及び第４位は３つのアミノ酸のいずれで満たされていてもよく、かつ第６位は２つのアミノ酸どちらかで満たされていてよい。
あるタンパク質ファミリー、例えば、非常に多くのメンバーを有するファミリー、又は全メンバーにわたって単一のシグネチャーモチーフを同定できないファミリー、又は単一のシグネチャーモチーフを基礎としてsiRNA発現ライブラリーを設計すると機能的に複雑すぎるライブラリーを生じさせるであろうファミリーについては、本発明の実施は、シグネチャーモチーフの１以上の変種を同定することを含み、該変種は、該タンパク質ファミリーを構成するタンパク質のサブセット（部分集合）のみに特徴的であるアミノ酸配列を表す。代表例は、現在89の既知メンバーを有するチロシンキナーゼファミリーである。実施例２で示されるように、このファミリーのシグネチャーモチーフの少なくとも７つの変種を同定することでき、各変種は全体としてファミリーのサブセットを表し、このサブセットは２という少数メンバー、及び61という多数メンバーを含む。

III．コンセンサス配列の決定
上述したようにシグネチャーモチーフを同定したら、そのシグネチャーモチーフを共有する少なくともすべての既知タンパク質のアミノ酸をコードする核酸配列の組を表す“コンセンサス配列”にシグネチャーモチーフを“逆翻訳”する。“逆翻訳”過程は、シグネチャーモチーフ内の各アミノ酸について遺伝コードから可能なすべてのコドンを演繹することによって、或いは適切な配列データベース（例えば、Genbank）から該ファミリーの各メンバーについてシグネチャーモチーフに対応する特異的コーディング配列を抽出することによって実施することができる。コンセンサス配列の長さは、シグネチャーモチーフの長さによって変わりうる。典型的には、この長さは15〜30ヌクレオチド、さらに好ましくは18〜24ヌクレオチドである。
コンセンサス配列は、固定塩基及び可変塩基の両方を含む式で表すことができる。従って、上述し、かつ実施例１でされる核ホルモン受容体のシグネチャーモチーフについてのコンセンサス配列は以下のとおりである。
[(A/T/G)(C/T)(A/G/T/C)] [TG(T/C)] [(A/G)(A/G)(A/C/G/T)]
[(A/G)(C/G)(A/C/G/T)] [TG(T/C)] [(A/T)(A/C/G)(A/C/G)]
[(A/G)(C/G/T)(A/C/G/T)]

これから分かるように、可変塩基のうち、いくつかは完全にランダムであり、すなわちそれらは４つの可能な塩基、Ａ、Ｃ、Ｇ又はＴのいずれでもよい。他の塩基は、部分的にランダムであり、すなわちそれらは４つの可能な塩基の２つのみ、又は３つのみの所定塩基を含みうる。一般的に、コンセンサス配列の決定では、与えられたアミノ酸についてすべての可能なコドン変動が考慮されるが、siRNAライブラリーの複雑度(すなわち大きさ)を限定する必要性を含め、種々の理由のため、コンセンサス配列を制限して、該タンパク質ファミリーの既知メンバーを構成するアミノ酸のコードに対して既知の具体的なコドンだけを含むようにすることができる。

上述したように、タンパク質ファミリーについてコンセンサス配列を決定したら、該コンセンサス配列によって定義されるすべての核酸配列について単一バッチでDNAオリゴヌクレオチドを化学合成することができ、かつこれらを本発明のsiRNAライブラリーを発現可能な発現カセット中に組み込むためのsiRNAコーディング配列として利用することができる。この様式で発現されるsiRNAライブラリーは、所定のタンパク質ファミリー内の少なくともすべての既知タンパク質をコードする遺伝子をサイレンシングすることができるが、該ライブラリーは、まだ同定されていないか、又は天然には存在しない更なる遺伝子をサイレンシングすることもできるだろう。このように、上記の例では、核ホルモン受容体のファミリーの45個の既知メンバーのアミノ酸配列に基づいてシグネチャーモチーフを決定した。しかし、このシグネチャーモチーフに対応するコンセンサス配列に基づいて発現しうるsiRNAライブラリーは、ヌクレオチドコーディング配列の部分的ランダムのため、かなり多数のメンバーを含む。上記の例では、いずれか２つの塩基で満たされうる９つの位置と、いずれか３つの塩基で満たされうる４つの位置と、いずれか４つの塩基で満たされうる４つの位置があるので、コンセンサス配列によって表される順列の総数は２⁹ x ３⁴ x ４⁴、つまり10,616,832である。従って、発現されるであろうsiRNAライブラリーは10,616,832メンバーという複雑度を有し、かつ核ホルモン受容体のファミリーの既知メンバーをコードする遺伝子のみならず、該ファミリーの未だ知られていないメンバーとしてコードする遺伝子、並びに他の２個の読み枠内のタンパク質をコードする遺伝子及び該コンセンサス配列に相補的な遺伝子を含む該コンセンサス配列にマッチングする多くの他の遺伝子をもサイレンシングし得る。

IV．発現カセット
本発明のsiRNAライブラリー用発現カセットは、技術的に周知のいずれの方法によっても構築することができ、特に、本発明のコンセンサス配列によって定義される配列を有する場合のように、コーディング配列が部分的ランダム化ヌクレオチドを含む場合であっても二本鎖siRNAの両鎖の転写を可能とする方法によって構築することができる。
特に好ましい方法は、反対方向に配向された２個の適切なプロモーター間にsiRNAをコードする核酸配列を連結しうる二重プロモーター系の使用を含む。“反対方向”とは、一方のプロモーターが核酸の“センス”鎖に機能可能に連結され、かつ他方のプロモーターが“アンチセンス”鎖に機能可能に連結されるような２個のプロモーターの位置決めを指す(図１参照)。正しく配向される、プロモーターは、好ましくは問題のsiRNAをコードする最初の塩基のところで転写を開始する。後述する好ましいpolIII III型プロモーターを使用する場合、siRNAコーディング配列の最後に位置し、好ましくは反対のプロモーターの３'端に位置する少なくとも４個のチミジル残基を含む特異的な終結配列のところで転写が終止する。終結配列に加え、本発現カセット構築物は、場合によりsiRNAをコードする配列の回収を容易にするための制限部位を含むことができる。この制限部位は、好ましくは４個のチミジル残基の５'及びTATAボックスに対して３'に位置し、かつ好ましくは技術的に知られているような部位特異的突然変異導入法を用いて、プロモーター配列の既存塩基の置換によって生じさせる。とにかく４個のチミジル残基の５'領域、及びTATAボックス３'側領域内で０〜20個の塩基を修飾して制限配列、オペレーター配列又は他の遺伝若しくはクローニング要素を生じさせることができる。センスsiRNA鎖が反対向きに方向づけられたプロモーター間に連結されると、アンチセンスsiRNA鎖をコードする核酸が好ましくは酵素的に合成される。あるいは、アンチセンスsiRNA鎖をコードする核酸を反対向きに方向づけられたプロモーター間に連結し、引き続きセンスsiRNA鎖をコードする核酸を酵素的に合成することができる。DNAオリゴヌクレオチド合成の酵素的方法は、Sambrook and Russel, Molecular Cloning: A Laboratory Manual, 3^rd ed. (2001)に記載されているようなクレノウ、T7、T4、Taq又は大腸菌DNAポリメラーゼをしばしば利用する。二重プロモーターsiRNA発現カセットの構築方法は、米国特許出願番号10/626,512に記載されており、この出願の教示は参照によって本明細書に取り込まれる。

あるいは、単一プロモーターからヘアピンsiRNA(shRNAs)が発現されるように発現カセットを構築することができる[例えばPaddison, P.J.ら Genes and Development, 16: 948-958 (2002); Brummelkamp, T.R.ら Science, 296: 550-553 (2002)]。部分的ランダム化オリゴヌクレオチドからのヘアピンsiRNA発現カセットの構築方法は、米国特許出願番号10/628,587に記載されており、この出願の教示は参照によって本明細書に取り込まれる。
別の実施形態ではポリメラーゼ連鎖反応(PCR)を用いてsiRNA発現カセットが構築される。当業者は、PCRによってsiRNAコーディング領域の各末端に機能性pol IIIプロモーターを機能可能に連結できることが分かるだろう[例えば、Methods in Molecular Biology, Vol. 15: PCR Protocols: Current Methods and Applications. White, B.A., ed. Humana Press, Inc., Totowa, NJ (1993)参照]。このアプローチは、プライミング部位として役立つように半ランダム化オリゴヌクレオチドの各末端にオリゴヌクレオチド伸長部の付加を必要とする。オリゴヌクレオチド伸長部の配列は、pol IIIプロモーターの選択に依る。

本発明の発現カセットで使うために選択される具体的なプロモーターは、該発現カセット内にコードされるsiRNAによってどの生物又は細胞型を標的化するかによって決まる。例えば、植物細胞を標的にする場合、植物プロモーターを使用すべきである。用途及び望まれる結果に依存して、プロモーターは構成的、誘導性、又は細胞依存性であり得る。プロモーターは同一である必要はないが、それらは同一でもよい。それらは異なるタイプ、異なる遺伝子から単離され、異なる制御を受けてもよく、或いは１塩基程度僅かに異なってよい。
好ましくは、カセットのコーディング領域を設計するとき最高度のフレキシビリティーが可能となるように、プロモーターはいかなる遺伝子内プロモーター要素をも必要としない。プロモーターは転写開始点で特定のヌクレオチドを必要としないことが好ましいが、いくつかのポリメラーゼによって特異的に要求される最初の位置のＧ又はＡを含め、いくらかの特異性は許容される。上記基準を満たす特に好ましいプロモーターは、ヒトU6小核RNA遺伝子プロモーター及びヒトH1 RNA用プロモーターのようなIII型のRNAポリメラーゼIII(pol III)である。このようなプロモーターは細胞型特異的発現がなく構成的に転写物を生産することができるが、オペレーター配列を操作してこれらのプロモーターに誘導性を与えることができる。短いRNA分子をインビボ生産するためのU6遺伝子転写シグナルの使用は、Miyagishi and Taira, Nature Biotechnology, 20:497-500 (2002); Lee, Nan Sookら, Nature Biotechnology, 20:500-505 (2002); Noonbergら, Nucleic Acids Res., 22:2830-2836 (1995)によって記載され、かつH1 RNAプロモーターの使用は、Baerら, Nucleic Acids Res., 18:97-103 (1990)及びHannonら, J. Biol. Chem., 266:22796-22799 (1991)によって記載されている。U6プロモーター及びヒトH1プロモーターのような上述した好ましいプロモーターは、転写開始部位のシス作用性プロモーター要素上流のすべてを含む。これら上流配列要素として、図１に示されるように、TATAボックス(Mattajら, Cell, 55:435-442 (1988))、近位配列要素(PSE)、及びいくつかの状況では、遠位配列要素(DSE, Gupta and Reddy, Nucleic Acids Res., 19:2073-2075 (1991))が挙げられる。あるいは、tRNAプロモーター[Kawasaki and Taira, Nucl. Acids Res, 31: 700-707 (2003)]及びpol IIプロモーター[Xia, H.ら, Nat. Biotechnol., 20: 1006-1010 (2002)]を使用しうる。

Ｖ．siRNAライブラリーを構築するための一般的組換え法
本発明の実施に好適な発現カセットの構築は、分子生物学の当業者に周知の方法を利用する。一般に、プラスミド、バクテリオファージDNA、又はレトロウイルス、アデノウイルス、若しくは他のウィルスベクターのようなDNA伝達ベクター中に発現カセットを連結することができる。本発明の発現カセットに対応する遺伝物質を含有する適切な伝達ベクターで、siRNAが宿主細胞内で転写されるように、原核生物又は真核生物宿主細胞に形質移入又は形質導入することができる。DNA伝達ベクター中に前もって連結せずに、トランスフェクションによって宿主細胞に直接siRNA発現カセットを送達することもできる[例えば、Castanotto, D.ら, RNA 8: 1454-1460 (2002)参照]。
発現カセットを調製する際、DNA配列を細菌プラスミド中に挿入又は置換することができる。細菌性複製系、細菌内での選択を可能にするマーカー、及び一般的に好都合な位置にある１以上のユニーク(unique)な制限部位を有することを特徴とするいずれの便利なプラスミドも利用しうる。ベクターと呼ばれるこれらのプラスミドとして、pACYC184、pACYC177、pBR322、pUC9、及びそれらの誘導体のようなベクターが挙げられる。マーカーの性質、好都合な制限部位の利用可能性、コピー数などに基づいてしばしば特定のプラスミドが選択される。引き続き、siRNAをコードするDNA配列を適切な制限部位のところでベクター中に挿入することができ、得られたプラスミドを用いて大腸菌宿主を形質転換する。形質転換した大腸菌を適切な栄養培地内で培養後、細菌を収集し、可溶化してプラスミドを回収する。

本発明に関連して使用する般的方法を開示する基本テキストとして、Sambrook and Russell, Molecular Cloning: A Laboratory Manual 3d ed. (2001); Gelvinら, eds. Plant Molecular Biology Manual (1990); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990);及びAusubelら, Current Protocols in Molecular Biology (1994)が挙げられる。

線状オリゴヌクレオチドの化学合成は技術的に周知であり、かつホスホラミダイト、ホスファイトトリエステル、H-ホスホネート及びホスホトリエステル法を含む数種の合成手順のいずれか、通常自動化合成法によって調製することができる。Beaucage and Caruthers, Tetrahedron Letts., 22:1859-1862 (1981);Needham-VanDevanterら, Nucleic Acids Res., 12:6159-6168 (1984)。さらに、当業者に知られる種々の市販供給元にオリゴヌクレオチドを特注製造及び注文することもできる。本発明に従ってオリゴヌクレオチドを調製するとき、各“ゆらぎ”位置が、コンセンサス配列によって規定された当該位置に許される２つのヌクレオチドの１つ、又は３つのヌクレオチドの１つ、又は４つのヌクレオチドの１つでランダムに満たされるように、コンセンサス配列内での固定されないヌクレオチドのランダム化について合成機に適切な指示を与えることが理解されよう。
本発明の実施で利用する単離かつ合成オリゴヌクレオチドの配列は、クローニング後、例えばWallaceら, Gene, 16:21-26 (1981)の二本鎖鋳型のシークエンシングのための鎖停止反応法を用いて検証することができる。

VI．ライブラリー複雑度の低減
既に示したように、本発明は、本発明によって生成されるsiRNAライブラリーの複雑度(メンバー数)について有意な柔軟性を提供する。この柔軟性は、ライブラリーの設計及び構築に関与するいくつかのパラメーターを変更できることの結果である。これらパラメーターには、シグネチャーモチーフの長さ及び全メンバーで不変であるシグネチャーモチーフ内のアミノ酸位置の数が含まれる。従って、より短いシグネチャーモチーフ（例えば、７つではなく６つのアミノ酸）又は不変である多数のアミノ酸を有するシグネチャーモチーフは、一般的により高割合の不変である塩基を有するコンセンサス配列に“逆翻訳”され、その結果として該コンセンサス配列に基づいて生成されるライブラリーは、より少数メンバーしか含まないであろう。同様に、コンセンサス配列を短くすることによって（例えば、後述する実施例１で示すように、配列の３'端又は５'端のどちらかで１個以上のヌクレオチド位置を除去することによって）、或いは既に示したように、遺伝コードの縮重に基づくすべての可能なコドンではなく、注目するタンパク質ファミリーの既知メンバーのアミノ酸配列をコードするコドンだけを利用することによって、コンセンサス配列を含むヌクレオチドのランダム性を制限してライブラリーの複雑度を低減することもできる。

ライブラリーの複雑度を低減するためのさらなる効率的方法は、問題のタンパク質ファミリーのメンバーを２つ以上のサブセットに分割し、各サブセットはシグネチャー配列の変種を有するメンバーを含み、このような各変種は、該サブセットの全メンバーにとって不変であるかなり多数のアミノ酸を含む。このような分割の効果は、実施例２及びチロシンキナーゼのファミリーの89の既知メンバーの７つのサブセットへの分割を示す下表１を参照すると明らかに分かるだろう。サブセット１及び４〜７はそれぞれシグネチャーモチーフの異なる変種を有するが、５つすべてがそれぞれのサブセットの全メンバーにとって不変である７個のアミノ酸を含む。サブセット３はこのサブセットの全メンバーにとって７個のアミノ酸の１個だけが不変でない変種シグネチャー配列を有し；かつサブセット２だけが、全メンバーにとって３個のアミノ酸が不変でない変種シグネチャーモチーフを有する。

表１

このファミリーのこの７つのサブセットへの分割の結果として、およびシグネチャーモチーフの各変種をコンセンサス配列に翻訳するときに既知コドンのみを考慮するという事実のさらなる結果として、ライブラリーの合計の複雑度が有意に低減する。チロシンキナーゼファミリーの場合、もしこの分割なしでsiRNAライブラリーを生成すると、ライブラリーの複雑度は数千万のオーダーにあるだろう。表１から分かるように、表に列挙した７つのサブセットへのこのような分割を行った場合、その効果は、たった24,068のメンバーを有するライブラリーの生成を可能にすることである。このようなライブラリーは、７つの各コンセンサス配列に基づいて合成したすべてのDNAオリゴヌクレオチドを合わせて、これらを発現カセットに連結することによって形成されることが分かり；好ましい実施形態では、均一な複雑さの24,068メンバーを得るため、カセット内組込みに先だって、それらの複雑度に正比例させて７バッチのオリゴヌクレオチドを一緒に混合する。
本明細書及び実施例で述べるいずれの方法を利用しても、50程度という少数の固有メンバー又は100万以上という多数のメンバーを含む効率的なsiRNAライブラリーを設計できるが、典型的には、大部分のライブラリーは20,000〜100,000の範囲内の固有メンバーであろう。

VII．組換えベクター
宿主細胞内で自己複製できるベクター中に本発明のsiRNA発現カセットを組み込むことができる。当業者には分かるように、本発明と共に使うために多種多様なこのようなベクターが適合しうる。あるタイプのベクターは発現カセットの増幅を可能にする。他のタイプのベクターは、細胞への発現カセットの効率的導入及び一度導入したそれらの安定した発現のために必要である。本発明のDNA発現を受容できるいずれのベクターも本発明の目的に適した組換えベクターとして考慮される。ベクターは、宿主ゲノム中に組み込まれ、又はエピソーム形態で維持される、いずれの環状又は線状のDNA長でもよい。ベクターを宿主細胞中に効率的に導入するためのさらなる操作又は特定条件が必要なことがあり(例えば、多数の発現プラスミド)、或いはベクターが組換えウィルスのような自己組込み型の細胞特異的な系の一部でもよい。

ウィルスベクターによる細胞の感染は、本発明のsiRNA発現ライブラリーを導入するための好ましい方法である。典型的な哺乳類ウィルスベクター系として、アデノウイルスベクター、１型アデノ随伴(“AAV-1”)又は２型アデノ随伴(“AAV-2”)ウィルスベクター、肝炎δベクター、生きている弱毒δウィルス、ヘルペスウイルスベクター、αウィルスベクター、又はレトロウイルスベクター（レンチウィルスベクターを含む）が挙げられる。
本発明のsiRNA発現ライブラリーは、形質移入及び技術的に知られた他の物理的方法で宿主細胞に導入することもできる。

VIII．本発明のための使用
本発明の主用途の１つは、Inverse Genomics(登録商標)のような技術を利用して、疾病過程に関与する遺伝子を同定する目的のために所定遺伝子ファミリーを標的にするsiRNAのライブラリーを使用することである。一般的には、これらの技術はsiRNA発現ライブラリーで細胞集団を形質移入（トランスフェクション）又は形質導入（トランスダクション）する工程、及びmRNA、増殖、分化、アポトーシス、又は老衰などの発現の増減のような何らかの表現型の変化について該細胞集団をモニターする工程を含む。例えば、チロシンキナーゼファミリーを標的にするsiRNAライブラリーを用いて、以下のとおり正常なアポトーシス経路で機能するチロシンキナーゼを同定することができる。レトロウイルスベクターによる形質導入によって細胞集団にライブラリーを送達する。この形質導入した細胞を、正常細胞内でアポトーシスを誘導する刺激にさらす（例えば、エトポシド、シスプラチン、又は電離放射線による処理）。処理した細胞の大多数がこの処理によって死ぬだろう。しかし、チロシンキナーゼが該刺激の下流のアポトーシス経路に関与すると、このチロシンキナーゼに抗してsiRNAを発現する細胞は、アポトーシス経路におけるsiRNA媒介欠損のため生き延びるだろう。PCR又は当業者に既知の他の方法によって、その生存細胞からsiRNA発現カセットを救出する。次に、アポトーシス経路内で機能すると推定されるチロシンキナーゼがこのsiRNA配列から同定される。

遺伝子発現のレベルをタンパク質レベルで決定することもできる。当業者は、種々の免疫学的アッセイを日常的に用いて、特にタンパク質産物と特異的に反応するポリクロナール又はモノクロナール抗体を用いて遺伝子産物のレベルを測定する。さらに、機能アッセイを行って、形質移入／形質導入された細胞内での１種以上の遺伝子の抑制された発現を確認することもできる。特定の遺伝子ファミリー及び該遺伝子産物が正常に発揮する既知の生物学的機能に依存して、活性の低減レベルを検出するための特異的アッセイを設計することができる。例えば、標的遺伝子ファミリーが酵素をコードする場合、形質移入又は形質導入細胞内での酵素活性を検出するために適した基質を用いて特有の酵素アッセイを行うことができる。例えば、標的遺伝子がキナーゼをコードする場合、形質移入又は形質導入細胞内でのキナーゼ活性の欠損は、基質のリン酸化のレベル減少で反映され；標的遺伝子がサイトカイン受容体のような受容体をコードする場合、遺伝子発現の減少はリガンドに対する応答の減少で反映され；標的遺伝子が腫瘍サプレッサー又は発癌遺伝子をコードする場合、その遺伝子発現の減少は、例えば、形質移入又は形質導入細胞の腫瘍形成傾向及び／又は転移可能性の変化に反映されうる。低減した遺伝子発現を示しうる表現型の他の可能性のある変化としてウィルス感受性−HIV感染症；自己免疫性−リンパ球の不活性化；薬物感受性−薬物毒性及び効力；移植片拒絶−MHC抗原提示などが挙げられる。

この明細書で引用したすべての刊行物及び特許出願は、それぞれ個々の刊行物又は特許出願を具体的かつ個々に参照したかのように、引用によって本明細書に取り込まれるものとする。
前記発明を明瞭及び理解のための説明及び実例によっていくらか詳細に述べたが、添付の請求項の精神と範囲を逸脱することなくさらに特定の変更及び修正を為しうることは、この発明の教示に照らして当業者に容易に分かるだろう。
上述した開示から明らかなように、本発明は種々多様な用途を有する。従って、以下の実施例は、説明目的のため提示され、いかなる場合にも本発明についての限定として解釈されることを意図しない。当業者には、本質的に同様の結果を生じさせるために変更又は修正しうる種々の非本質的パラメーターが容易に分かるだろう。

（実施例）
本実施例で用いるアミノ酸の記号は以下のとおりである。
ＡアラニンＭメチオニン
ＣシステインＮアスパラギン
Ｄアスパラギン酸Ｐプロリン
Ｅグルタミン酸Ｑグルタミン
ＦフェニルアラニンＲアルギニン
ＧグリシンＳセリン
ＨヒスチジンＴスレオニン
ＩイソロイシンＶバリン
ＫリジンＷトリプトファン
ＬロイシンＹチロシン

（実施例１）
ヒト核ホルモン受容体(ZnF_C4ドメイン)−45メンバー
この実施例では、核ホルモン受容体ファミリーの45個すべての既知メンバー中に存在するジンクフィンガードメインに基づいて単一のシグネチャーモチーフを設計した。45の各既知ファミリーメンバー中に存在するジンクフィンガードメインの短いセグメントを以下に示す。該ファミリーの既知メンバーのシグネチャーモチーフ領域をコードするコドンだけを利用してコンセンサス配列を“逆翻訳”した。全21-ヌクレオチドコンセンサス配列を用いてsiRNAライブラリーを構築すると、複雑度は10,616,832だろう。コンセンサス配列の長さを19ヌクレオチドに減らすことによって、複雑度は884,736に低減する。19ヌクレオチドという短いsiRNAは、その同族mRNAレベルの低減に関して非常に効率的[Czauderna, F.ら, Nucl. Acids Res. 31: 2705-2716 (2003)]なので、コンセンサス配列の長さを減らすことは、たとえあるとしても、該ライブラリーのメンバーによって引き起こされるサイレンシングの度合にほとんど影響しない。

tataatgcactgacctgtgaggggtgtaaaggtttcttcaggaga (配列番号1)
Y N A L T C E G C K G F F R R (配列番号2)
tacggcgtgcgcacctgtgagggctgcaaaggcttctttaagcgc (配列番号3)
Y G V R T C E G C K G F F K R (配列番号4)
tacggcgtgcgcacctgtgagggctgcaaaggcttctttaagcgc (配列番号5)
Y G V R T C E G C K G F F K R (配列番号6)
tacggcgtgcgaacctgcgagggctgcaagggctttttcaagaga (配列番号7)
Y G V R T C E G C K G F F K R (配列番号8)
tatggtgtccgcacatgtgagggctgcaagggcttcttcaagcgc (配列番号9)
Y G V R T C E G C K G F F K R (配列番号10)
tatggagcagtaacttgtgaaggctgcaaaggattttttaaaaga (配列番号11)
Y G A V T C E G C K G F F K R (配列番号12)
tacggggttatcacctgtgaggggtgcaagggcttcttccgccgg (配列番号13)
Y G V I T C E G C K G F F R R (配列番号14)
tacggagtcatcacatgtgaaggctgcaagggattctttaggagg (配列番号15)
Y G V I T C E G C K G F F R R (配列番号16)
tatggtgtcattacatgtgaaggctgcaagggctttttcaggaga (配列番号17)
Y G V I T C E G C K G F F R R (配列番号18)
tatggagtgtacagctgcgaggggtgcaagggcttcttcaagcgg (配列番号19)
Y G V Y S C E G C K G F F K R (配列番号20)
tacggggtttacagctgtgagggttgcaagggcttcttcaaacgc (配列番号21)
Y G V Y S C E G C K G F F K R (配列番号22)
tacggggtatacagttgtgaaggctgcaaagggttcttcaagagg (配列番号23)
Y G V Y S C E G C K G F F K R (配列番号24)
tacaacgtgctcagctgcgaaggctgcaagggcttcttccggcgc (配列番号25)
Y N V L S C E G C K G F F R R (配列番号26)
tacaatgttctgagctgcgagggctgcaagggattcttccgccgc (配列番号27)
Y N V L S C E G C K G F F R R (配列番号28)
tatgggatcatctcctgtgagggctgcaaagggtttttcaagcgg (配列番号29)
Y G I I S C E G C K G F F K R (配列番号30)
tatggggtcagctcttgtgaaggctgcaagggcttctttcgccga (配列番号31)
Y G V S S C E G C K G F F R R (配列番号32)
tatggggtcagctcttgtgaaggctgcaagggcttctttcgccga (配列番号33)
Y G V S S C E G C K G F F R R (配列番号34)
tatggggctgtcagttgtgaaggttgcaaaggtttcttcaaaagg (配列番号35)
Y G A V S C E G C K G F F K R (配列番号36)
tacggtgtcttcacctgcgagggctgcaagagctttttcaagcga (配列番号37)
Y G V F T C E G C K S F F K R (配列番号38)
tacggccagttcacgtgcgagggctgcaagagcttcttcaagcgc (配列番号39)
Y G Q F T C E G C K S F F K R (配列番号40)
tacggggtctacgcctgcgacggctgctcaggttttttcaaacgg (配列番号41)
Y G V Y A C D G C S G F F K R (配列番号42)
tatggcatctatgcctgcaacggctgcagcggcttcttcaagagg (配列番号43)
Y G I Y A C N G C S G F F K R (配列番号44)
tatggggcatccacctgtgatgggtgcaagggtttcttcagacgc (配列番号45)
Y G A S T C D G C K G F F R R (配列番号46)
tacggtgcctcgagctgtgacggctgcaagggcttcttccggagg (配列番号47)
Y G A S S C D G C K G F F R R (配列番号48)
tatggggtcagcgcctgtgagggctgcaagggcttcttccgccgc (配列番号49)
Y G V S A C E G C K G F F R R (配列番号50)
tatggggtcagcgcctgtgagggatgtaagggctttttccgcaga (配列番号51)
Y G V S A C E G C K G F F R R (配列番号52)
tacggtgtgcacgcctgcgagggctgcaagggctttttccgtcgg (配列番号53)
Y G V H A C E G C K G F F R R (配列番号54)
tatggagttcatgcttgcgaaggctgtaagggtttctttcggaga (配列番号55)
Y G V H A C E G C K G F F R R (配列番号56)
tacggtgttcatgcatgtgaggggtgcaagggcttcttccgtcgt (配列番号57)
Y G V H A C E G C K G F F R R (配列番号58)
tacggagtccacgcgtgtgaaggctgcaagggcttctttcggcga (配列番号59)
Y G V H A C E G C K G F F R R (配列番号60)
tatggagttcatgcttgtgaaggatgcaagggtttcttccggaga (配列番号61)
Y G V H A C E G C K G F F R R (配列番号62)
ttcaatgtcatgacatgtgaaggatgcaagggctttttcaggagg (配列番号63)
F N V M T C E G C K G F F R R (配列番号64)
tttaatgcgctgacttgtgagggctgcaagggtttcttcaggaga (配列番号65)
F N A L T C E G C K G F F R R (配列番号66)
taccgctgtatcacgtgtgaaggctgcaagggtttctttagaaga (配列番号67)
Y R C I T C E G C K G F F R R (配列番号68)
taccgctgtatcacttgtgagggctgcaagggcttctttcgccgc (配列番号69)
Y R C I T C E G C K G F F R R (配列番号70)
tacggactgctcacgtgtgagagctgcaagggcttcttcaagcgc (配列番号71)
Y G L L T C E S C K G F F K R (配列番号72)
tatgggctcctcacctgtgaaagctgcaagggattttttaagcga (配列番号73)
Y G L L T C E S C K G F F K R (配列番号74)
tatggggtagtcacctgtggcagctgcaaagttttcttcaaaaga (配列番号75)
Y G V V T C G S C K V F F K R (配列番号76)
tatggagctctcacatgtggaagctgcaaggtcttcttcaaaaga (配列番号77)
Y G A L T C G S C K V F F K R (配列番号78)
tatggtgtccttacctgtgggagctgtaaggtcttctttaagagg (配列番号79)
Y G V L T C G S C K V F F K R (配列番号80)
tatggagtcttaacttgtggaagctgtaaagttttcttcaaaaga (配列番号81)
Y G V L T C G S C K V F F K R (配列番号82)
tacggcgtggcctcctgcgaggcttgcaaggccttcttcaagagg (配列番号83)
Y G V A S C E A C K A F F K R (配列番号84)
tatggtgtggcatcctgtgaggcctgcaaagccttcttcaagagg (配列番号85)
Y G V A S C E A C K A F F K R (配列番号86)
tatggagtctggtcctgtgagggctgcaaggccttcttcaagaga (配列番号87)
Y G V W S C E G C K A F F K R (配列番号88)
tatggagtctggtcgtgtgaaggatgtaaggccttttttaaaaga (配列番号89)
Y G V W S C E G C K A F F K R (配列番号90)

シグネチャーモチーフ：
(T/S/A)-C-(D/E/G/N)-(G/S/A)-(C)-(K/S)-(A/G/S/V)

コンセンサス配列(21 nt)：
(A/T/G)(C/T)(A/G/T/C) TG(T/C) (A/G)(A/G)(A/C/G/T)
T/S/A C D/E/G/N
(A/G)(C/G)(A/C/G/T) TG(T/C) (A/T)(A/C/G)(A/C/G)
G/S/A C K/S
(A/G)(C/G/T)(A/C/G/T)
G/S/V/A
複雑度：2⁹ x 3⁴ x 4⁴＝512 x 81 x 256＝10,616,832メンバー

コンセンサス配列(19 nt)：
(A/T/G)(C/T)(A/G/T/C) TG(T/C) (A/G)(A/G)(A/C/G/T)
T/S/A C D/E/G/N
(A/G)(C/G)(A/C/G/T) TG(T/C) (A/T)(A/C/G)(A/C/G)
G/S/A C K/S
(A/G)--
G/S/V/A
複雑度：2⁹ x 3³ x 4³＝512 x 27 x 64＝884,736メンバー

（実施例２）
チロシンキナーゼのファミリー−89メンバー
この実施例は、チロシンキナーゼのファミリーの触媒ドメインの部分の７つの変種の同定を示す。上表１に示されるように、これらを用いて24,068個の固有メンバーという低減した複雑度を有する、このドメインを標的にするsiRNAのライブラリーを生成した。

変種１：３メンバー
gttcccatcatccaccgcgaccttaagtccagcaacatattgatcctc (配列番号91)
V P I I H R D L K S S N I L I L (配列番号92)
gtgcccatcctgcaccgggacctcaagtccagcaacattttgctactt (配列番号93)
V P I L H R D L K S S N I L L L (配列番号94)
gtgcccatcctgcaccgggacctcaagtccagcaacattttgctactt (配列番号95)
V P I L H R D L K S S N I L L L (配列番号96)

シグネチャーモチーフ：H R D L K S S

コンセンサス配列：
CAC CG(C/G) GAC CT(C/T) AAG TCC AGC
H R D L K S S
複雑度：2²＝4メンバー

変種２：３メンバー
catggtatggtgcatagaaacctggctgcccgaaacgtgctactcaag (配列番号97)
H G M V H R N L A A R N V L L K (配列番号98)
aagaattgcatccaccgggacgtggcagcgcgtaacgtgctgttgacc (配列番号99)
K N C I H R D V A A R N V L L T (配列番号100)
atcaactgcgtgcacagggacattgctgtccggaacatcctggtggcc (配列番号101)
I N C V H R D I A V R N I L V A (配列番号102)

シグネチャーモチーフ：H R D/N I/V/L A A/V R

コンセンサス配列：
CA(T/C) (C/A)G(G/A) (G/A)AC (A/C/G)T(T/G) GC(T/A) G(T/C)(C/G)
H R D/N) (I/V/L) A (A/V)
CG(A/T/G)
R
複雑度：2⁸ x 3²＝256 x 9＝2,304メンバー

変種３：８メンバー
atgaactacgtccaccgggaccttcgtgcagccaacatcctggtggga (配列番号103)
M N Y V H R D L R A A N I L V G (配列番号104)
atgaactatattcaccgagatcttcgggctgctaatattcttgtagga (配列番号105)
M N Y I H R D L R A A N I L V G (配列番号106)
atgaattatatccatagagatctgcgatcagcaaacattctagtgggg (配列番号107)
M N Y I H R D L R S A N I L V G (配列番号108)
atgaactacattcaccgcgacctgagggcagccaacatcctggttggg (配列番号109)
M N Y I H R D L R A A N I L V G (配列番号110)
aagaattccatccaccgcgacctgcgggcggccaacatcctggtgtct (配列番号111)
M N S I H R D L R A A N I L V S (配列番号112)
aggaactacatccaccgagacctccgagctgccaacatcttggtctt (配列番号113)
R N Y I H R D L R A A N I L V S (配列番号114)
aagaactacattcaccgggacctgcgagcagctaatgttctggtctcc (配列番号115)
K N Y I H R D L R A A N V L V S (配列番号116)
cggaattatattcatcgtgaccttcgggctgccaacattctggtgtct (配列番号117)
R N Y I H R D L R A A N I L V S (配列番号118)

シグネチャーモチーフ：H R D L R A/S A

コンセンサス配列：
CA(C/T) (C/A)G(A/C/G/T) GA(C/T) CT(C/G/T) (A/C)G(A/G/T)
H R D L R
(G/T)C(A/G/T) GC(A/C/T)
(A/S) A
複雑度：2⁵ x 3⁴ x 4＝32 x 81 x 4＝10,368メンバー

変種４：９メンバー
ctgcattttgtgcaccgggacctggccacacgcaactgtctagtggg (配列番号119)
L H F V H R D L A T R N C L V G (配列番号120)
ctcaactttgtacatcgggacctggccacgcggaactgcctagttggg (配列番号121)
L N F V H R D L A T R N C L V G (配列番号122)
cttaattttgttcaccgagatctggccacacgaaactgtttagtgggt (配列番号123)
L N F V H R D L A T R N C L V G (配列番号124)
cgcgggctggtgcaccgagacctcgctacgcgcaacctactgctggcg (配列番号125)
R G L V H R D L A T R N L L L A (配列番号126)
aaaaggtatatccacagggatctggcaacgagaaatatattggtggag (配列番号127)
K R Y I H R D L A T R N I L V E (配列番号128)
cagcactttgtgcaccgagacctggccaccaggaactgcctggttgga (配列番号129)
Q H F V H R D L A T R N C L V G (配列番号130)
cagcacttcgtgcaccgcgatttggccaccaggaactgcctggtcggg (配列番号131)
Q H F V H R D L A T R N C L V G (配列番号132)
caccacgtggttcacaaggacctggccacccgcaatgtgctagtgtac (配列番号133)
H H V V H K D L A T R N V L V Y (配列番号134)
cgtaagtttgttcaccgagatttagccaccaggaactgcctggtgggc (配列番号135)
R K F V H R D L A T R N C L V G (配列番号136)

シグネチャーモチーフ：H R/K D L A T R

コンセンサス配列：
CAC (A/C)(A/G)(A/C/G) GA(C/T) (C/T)T(A/C/G) GC(A/C/T)
H R/K D L A
AC(A/C/G) (A/C)G(A/C/G)
T R
複雑度：2⁵ x 3⁵＝32 x 81＝2,592メンバー

変種５：61メンバー
aagaagcttgtgcaccgcgacctggccgcccgcaacatcctggtctca (配列番号137)
K K L V H R D L A A R N I L V S (配列番号138)
aagaagcttgtgcaccgggacctagccgcccgcaacatcctggtctca (配列番号139)
K K L V H R D L A A R N I L V S (配列番号140)
aacaatttcgtgcatcgagacctggctgcccgcaatgtgctggtgtct (配列番号141)
N N F V H R D L A A R N V L V S (配列番号142)
cacgactacatccaccgagacctagccgcgcgcaacgtgctgctggac (配列番号143)
H D Y I H R D L A A R N V L L D (配列番号144)
cggcaatacgttcaccgggacttggcagcaagaaatgtccttgttgag (配列番号145)
R Q Y V H R D L A A R N V L V E (配列番号146)
cgtcgcttggtgcaccgcgacctggcagccaggaacgtactggtgaaa (配列番号147)
R R L V H R D L A A R N V L V K (配列番号148)
cggaacttcatccaccgagacctggctgctcggaattgcatgctggca (配列番号149)
R N F I H R D L A A R N C M L A (配列番号150)
aagaagtgcatacaccgagacctggcagccaggaatgtcctggtgaca (配列番号151)
K K C I H R D L A A R N V L V T (配列番号152)
caaaaatgtattcatcgagatttagcagccagaaatgttttggtaaca (配列番号153)
Q K C I H R D L A A R N V L V T (配列番号154)
cagaagtgcatccacagggacctggctgcccgcaatgtgctggtgacc (配列番号155)
Q K C I H R D L A A R N V L V T (配列番号156)
cagaagtgtattcacagagacttggctgccagaaacgtcctggtgacc (配列番号157)
Q K C I H R D L A A R N V L V T (配列番号158)
cggaagtgtatccaccgggacctggctgcccgcaatgtgctggtgact (配列番号159)
R K C I H R D L A A R N V L V T (配列番号160)
atgaagctcgttcatcgggacttggcagccagaaacatcctggtagct (配列番号161)
M K L V H R D L A A R N I L V A (配列番号162)
agaaagtgcattcatcgggacctggcagcgagaaacattcttttatct (配列番号163)
R K C I H R D L A A R N I L L S (配列番号164)
cgaaagtgcatccacagagacctggctgctcggaacattctgctgtcg (配列番号165)
R K C I H R D L A A R N I L L S (配列番号166)
cgaaagtgtatccacagggacctggcggcacgaaatatcctcttatcg (配列番号167)
R K C I H R D L A A R N I L L S (配列番号168)
aagaactgcgtccacagagacctggcggctaggaacgtgctcatctgt (配列番号169)
K N C V H R D L A A R N V L I C (配列番号170)
aaaaattgtgtccaccgtgatctggctgctcgcaacgtcctcctggca (配列番号171)
K N C V H R D L A A R N V L L A (配列番号172)
aagaattgtattcacagagacttggcagccagaaatatcctccttact (配列番号173)
K N C I H R D L A A R N I L L T (配列番号174)
aagtcgtgtgttcacagagacctggccgccaggaacgtgcttgtcacc (配列番号175)
K S C V H R D L A A R N V L V T (配列番号176)
aaacagtttattcacagggacctagctgccaggaacattttagttggt (配列番号177)
K Q F I H R D L A A R N I L V G (配列番号178)
aagcagttcatccacagggacctggctgcccggaatgtgctggtcgga (配列番号179)
K Q F I H R D L A A R N V L V G (配列番号180)
aagcagttcatccacagggacctggctgcccggaatgtgctggtcgga (配列番号181)
K Q F I H R D L A A R N V L V G (配列番号182)
atgaactatgtgcaccgtgacctggctgcccgcaacatcctcgtcaac (配列番号183)
M N Y V H R D L A A R N I L V N (配列番号184)
atgcatttcattcacagggatctggcagctagaaattgccttgtttcc (配列番号185)
M H F I H R D L A A R N C L V S (配列番号186)
aacaagtttgtgcaccgagatctagcagcccgcaactgcatggtgtcc (配列番号187)
N K F V H R D L A A R N C M V S (配列番号188)
aataagttcgtccacagagaccttgctgcccggaattgcatggtagcc (配列番号189)
N K F V H R D L A A R N C M V A (配列番号190)
aagaagtttgtgcatcgggacctggcagcgagaaactgcatggtcgcc (配列番号191)
K K F V H R D L A A R N C M V A (配列番号192)
aagagattcatacaccgggacctggcggccaggaactgcatgctgaat (配列番号193)
K R F I H R D L A A R N C M L N (配列番号194)
atgaactatgttcaccgtgacctggctgcccgcaacatcctcgtcaac (配列番号195)
M N Y V H R D L A A R N I L V N (配列番号196)
atgaactatgtgcaccgcgacctggctgctcgcaacatccttgtcaac (配列番号197)
M N Y V H R D L A A R N I L V N (配列番号198)
atgaattatgtgcatcgggacctggctgctaggaacattctggtcaac (配列番号199)
M N Y V H R D L A A R N I L V N (配列番号200)
atgggctatgtgcatagagatcttgctgccagaaacatcttaatcaac (配列番号201)
M G Y V H R D L A A R N I L I N (配列番号202)
cagaagtttgtgcacagggacctggctgcgcggaactgcatgctggac (配列番号203)
Q K F V H R D L A A R N C M L D (配列番号204)
aaaaagtttgtccacagagacttggctgcaagaaactgtatgctggat (配列番号205)
K K F V H R D L A A R N C M L D (配列番号206)
atgggctatgttcaccgagacctcgctgctcggaacatcttgatcaac (配列番号207)
M G Y V H R D L A A R N I L I N (配列番号208)
aggaattttcttcatcgagatttagctgctcgaaactgcatgttgcga (配列番号209)
R N F L H R D L A A R N C M L R (配列番号210)
aaaaactgtatacacagggaccttgctgcaagaaactgcctggtaggt (配列番号211)
K N C I H R D L A A R N C L V G (配列番号212)
aagtgctgcatccaccgggacctggctgctcggaactgcctggtgaca (配列番号213)
K C C I H R D L A A R N C L V T (配列番号214)
atgagctatgtgcatcgtgatctggccgcacggaacatcctggtgaac (配列番号215)
M S Y V H R D L A A R N I L V N (配列番号216)
atgagctacgtccaccgagacctggctgctcgcaacatcctagtcaac (配列番号217)
M S Y V H R D L A A R N I L V N (配列番号218)
atgggctatgttcaccgagacctcgctgctcggaacatcttgatcaac (配列番号219)
M G Y V H R D L A A R N I L I N (配列番号220)
atgggatatgttcacagggaccttgcagctcgcaatattcttgtcaac (配列番号221)
M G Y V H R D L A A R N I L V N (配列番号222)
cgtcgcttggtgcaccgcgacctggcagccaggaacgtactggtgaaa (配列番号223)
R R L V H R D L A A R N V L V K (配列番号224)
gtgcggctcgtacacagggacttggccgctcggaacgtgctggtcaag (配列番号225)
V R L V H R D L A A R N V L V K (配列番号226)
agacgactcgttcatcgggatttggcagcccgtaatgtcttagtgaaa (配列番号227)
R R L V H R D L A A R N V L V K (配列番号228)
aaaaacttcatccacagagatcttgctgcccgaaactgcctggtaggg (配列番号229)
K N F I H R D L A A R N C L V G (配列番号230)
aagcgctttattcaccgtgacctggctgcccgcaatctgctgttggct (配列番号231)
K R F I H R D L A A R N L L L A (配列番号232)
aagaactttgtgcaccgtgacctggcggcccgcaacgtcctgctggtt (配列番号233)
K N F V H R D L A A R N V L L V (配列番号234)
aagaactttgtgcaccgtgacctggcggcccgcaacgtcctgctggtt (配列番号235)
K N F V H R D L A A R N V L L V (配列番号236)
agcaattttgtgcacagagatctggctgcaagaaatgtgttgctagtt (配列番号237)
S N F V H R D L A A R N V L L V (配列番号238)
cagaattacatccaccgggacctggccgccaggaacatcctcgtcggg (配列番号239)
Q N Y I H R D L A A R N I L V G (配列番号240)
cagcgcgttgtgcaccgggacttggccgcccggaacgtgctcgtggac (配列番号241)
Q R V V H R D L A A R N V L V D (配列番号242)
cggaactacattcacagagatctggctgccagaaatgtcctcgttggt (配列番号243)
R N Y I H R D L A A R N V L V G (配列番号244)
aagaatttcatccatagagatcttgcagctcgtaactgcctagtggga (配列番号245)
K N F I H R D L A A R N C L V G (配列番号246)
aacagcttcatccacagagatctggctgccagaaattgtctagtaagt (配列番号247)
N S F I H R D L A A R N C L V S (配列番号248)
aatggctatattcatagggatttggcggcaaggaattgtttggtcagt (配列番号249)
N G Y I H R D L A A R N C L V S (配列番号250)
gcatgtgtcatccacagagacttggctgccagaaattgtttggtggga (配列番号251)
A C V I H R D L A A R N C L V G (配列番号252)
caccaattcatacaccgggacttggctgctcgtaactgcttggtggac (配列番号253)
H Q F I H R D L A A R N C L V D (配列番号254)
aagcagttccttcaccgagacctggcagctcgaaactgtttggtaaac (配列番号255)
K Q F L H R D L A A R N C L V N (配列番号256)
cacaattatgtccaccgggacctggctgccagaaacatcttggtgaat (配列番号257)
H N Y V H R D L A A R N I L V N (配列番号258)

シグネチャーモチーフ：H R D L A A R

コンセンサス配列：
CA(C/T) (A/C)G(A/C/G/T) GA(C/T) (T/C)T(A/C/G/T) GC(A/C/G/T)
H R D L A
GC(A/C/G/T) (A/C)G(A/C/G/T)
A R
複雑度：2⁴ x 4⁵＝16 x 512＝8,192メンバー

変種６：３メンバー
agggaagtcatccacaaagacctggctgccaggaactgtgtcattgat (配列番号259)
R E V I H K D L A A R N C V I D (配列番号260)
aaccgctttgtgcataaggacttggctgcgcgtaactgcctggtcagt (配列番号261)
N R F V H K D L A A R N C L V S (配列番号262)
cacttctttgtccacaaggaccttgcagctcgcaatattttaatcgga (配列番号263)
H F F V H K D L A A R N I L I G (配列番号264)

シグネチャーモチーフ：H K D L A A R

コンセンサス配列：
CA(C/T) AA(A/G) GAC (C/T)T(G/T) GC(A/T) GC(C/G/T) A/C)G(C/G/T)
H K D L A A R
複雑度：2⁶ x 3²＝64 x 9＝576メンバー

変種７：２メンバー
aatcacttcatccacagggatattgccgcccggaactgcctgctgagc (配列番号265)
N H F I H R D I A A R N C L L S (配列番号266)
aaccacttcatccaccgagacattgctgccagaaactgcctcttgacc (配列番号267)
N H F I H R D I A A R N C L L T (配列番号268)

シグネチャーモチーフ：H R D I A A R

コンセンサス配列：
CAC G(A/G) GA(C/T) ATT GC(C/T) GCC (A/C)G(A/G)
H R D I A A R
複雑度：2⁵＝32メンバー

（実施例３）
ヒト核ホルモン受容体(ZnF_C4ドメイン)のファミリー−９群に分割した45メンバー
この実施例では、ヒト核ホルモン受容体ファミリーの45の既知メンバーを９つのサブグループに分割する。実施例１で述べたジンクフィンガー_C4ドメインの同一セグメントを用いて、９つのサブグループのそれぞれについて個々のシグネチャーモチーフとコンセンサス配列を設計した。実施例１のように、亜群の既知メンバーのシグネチャーモチーフ領域をコードする当該コドンだけを利用してコンセンサス配列を“逆翻訳”した。ファミリーのサブグループへの分割は、複雑度を10,616,832(実施例１参照)から1,664に劇的に低減させる。

変種１：９メンバー
tataatgcactgacctgtgaggggtgtaaaggtttcttcaggaga (配列番号1)
Y N A L T C E G C K G F F R R (配列番号2)
tacggcgtgcgcacctgtgagggctgcaaaggcttctttaagcgc (配列番号3)
Y G V R T C E G C K G F F K R (配列番号4)
tacggcgtgcgcacctgtgagggctgcaaaggcttctttaagcgc (配列番号5)
Y G V R T C E G C K G F F K R (配列番号6)
tacggcgtgcgaacctgcgagggctgcaagggctttttcaagaga (配列番号7)
Y G V R T C E G C K G F F K R (配列番号8)
tatggtgtccgcacatgtgagggctgcaagggcttcttcaagcgc (配列番号9)
Y G V R T C E G C K G F F K R (配列番号10)
tatggagcagtaacttgtgaaggctgcaaaggattttttaaaaga (配列番号11)
Y G A V T C E G C K G F F K R (配列番号12)
tacggggttatcacctgtgaggggtgcaagggcttcttccgccgg (配列番号13)
Y G V I T C E G C K G F F R R (配列番号14)
tacggagtcatcacatgtgaaggctgcaagggattctttaggagg (配列番号15)
Y G V I T C E G C K G F F R R (配列番号16)
tatggtgtcattacatgtgaaggctgcaagggctttttcaggaga (配列番号17)
Y G V I T C E G C K G F F R R (配列番号18)

シグネチャーモチーフ：T C E G C K G

コンセンサス配列：
A-C-(A/C/T) T-G-(C/T) G-A-(A/G) G-G-(C/G) T-G-(C/T)
T C E G C
A-A-(A/G) G-G-(A/C/T)
K G
複雑度：2⁵ x 3²＝32 x 9＝288

変種２：９メンバー
tatggagtgtacagctgcgaggggtgcaagggcttcttcaagcgg (配列番号19)
Y G V Y S C E G C K G F F K R (配列番号20)
tacggggtttacagctgtgagggttgcaagggcttcttcaaacgc (配列番号21)
Y G V Y S C E G C K G F F K R (配列番号22)
tacggggtatacagttgtgaaggctgcaaagggttcttcaagagg (配列番号23)
Y G V Y S C E G C K G F F K R (配列番号24)
tacaacgtgctcagctgcgaaggctgcaagggcttcttccggcgc (配列番号25)
Y N V L S C E G C K G F F R R (配列番号26)
tacaatgttctgagctgcgagggctgcaagggattcttccgccgc (配列番号27)
Y N V L S C E G C K G F F R R (配列番号28)
tatgggatcatctcctgtgagggctgcaaagggtttttcaagcgg (配列番号29)
Y G I I S C E G C K G F F K R (配列番号30)
tatggggtcagctcttgtgaaggctgcaagggcttctttcgccga (配列番号31)
Y G V S S C E G C K G F F R R (配列番号32)
tatggggtcagctcttgtgaaggctgcaagggcttctttcgccga (配列番号33)
Y G V S S C E G C K G F F R R (配列番号34)
tatggggctgtcagttgtgaaggttgcaaaggtttcttcaaaagg (配列番号35)
Y G A V S C E G C K G F F K R (配列番号36)

シグネチャーモチーフ：S C E G C K G

コンセンサス配列：
(A/T)-(C/G)-(C/T) T-G-(C/T) G-A-(A/G) G-G-(C/G/T) T-G-C
S C E G C
A-A-(A/G) G-G-(A/C/G/T)
K G
複雑度：2⁶ x 3 x 4＝64 x 3 x 4＝768

変種３：２メンバー
tacggtgtcttcacctgcgagggctgcaagagctttttcaagcga (配列番号37)
Y G V F T C E G C K S F F K R (配列番号38)
tacggccagttcacgtgcgagggctgcaagagcttcttcaagcgc (配列番号39)
Y G Q F T C E G C K S F F K R (配列番号40)

シグネチャーモチーフ：T C E G C K S

コンセンサス配列：
A-C-(C/G) T-G-C G-A-G G-G-C T-G-C A-A-(A/G) A-G-(C/T)
T C E G C K S
複雑度：2³＝8

変種４：２メンバー
tacggggtctacgcctgcgacggctgctcaggttttttcaaacgg (配列番号41)
Y G V Y A C D G C S G F F K R (配列番号42)
tatggcatctatgcctgcaacggctgcagcggcttcttcaagagg (配列番号43)
Y G I Y A C N G C S G F F K R (配列番号44)

シグネチャーモチーフ：A C D/N G C S G

コンセンサス配列：
G-C-C_ T-G-C (A/G)-A-C G-G-C T-G-C (A/T)-(C/G)-(A/C)
A C D/N G C S
G-G-(C/T)
G
複雑度：2⁵＝32

変種５：２メンバー
tatggggcatccacctgtgatgggtgcaagggtttcttcagacgc (配列番号45)
Y G A S T C D G C K G F F R R (配列番号46)
tacggtgcctcgagctgtgacggctgcaagggcttcttccggagg (配列番号47)
Y G A S S C D G C K G F F R R (配列番号48)

シグネチャーモチーフ：T/S C D G C K G

コンセンサス配列：
A-(C/G)-C T-G-T G-A-(C/T) G-G-(C/G) T-G-C A-A-G
S/T C D G C K
G-G-(C/T)
G
複雑度：2⁴＝16

変種６：７メンバー
tatggggtcagcgcctgtgagggctgcaagggcttcttccgccgc (配列番号49)
Y G V S A C E G C K G F F R R (配列番号50)
tatggggtcagcgcctgtgagggatgtaagggctttttccgcaga (配列番号51)
Y G V S A C E G C K G F F R R (配列番号52)
tacggtgtgcacgcctgcgagggctgcaagggctttttccgtcgg (配列番号53)
Y G V H A C E G C K G F F R R (配列番号54)
tatggagttcatgcttgcgaaggctgtaagggtttctttcggaga (配列番号55)
Y G V H A C E G C K G F F R R (配列番号56)
tacggtgttcatgcatgtgaggggtgcaagggcttcttccgtcgt (配列番号57)
Y G V H A C E G C K G F F R R (配列番号58)
tacggagtccacgcgtgtgaaggctgcaagggcttctttcggcga (配列番号59)
Y G V H A C E G C K G F F R R (配列番号60)
tatggagttcatgcttgtgaaggatgcaagggtttcttccggaga (配列番号61)
Y G V H A C E G C K G F F R R (配列番号62)

シグネチャーモチーフ：A C E G C K G

コンセンサス配列：
G-C-(A/C/G/T) T-G-(C/T) G-A-(A/G) G-G-(A/C/G) T-G-(C/T)
A C E G C
A-A-G G-G-(C/T)
K G
複雑度：2⁴ x 3 x 4＝16 x 12＝192

変種７：６メンバー
ttcaatgtcatgacatgtgaaggatgcaagggctttttcaggagg (配列番号63)
F N V M T C E G C K G F F R R (配列番号64)
tttaatgcgctgacttgtgagggctgcaagggtttcttcaggaga (配列番号65)
F N A L T C E G C K G F F R R (配列番号66)
taccgctgtatcacgtgtgaaggctgcaagggtttctttagaaga (配列番号67)
Y R C I T C E G C K G F F R R (配列番号68)
taccgctgtatcacttgtgagggctgcaagggcttctttcgccgc (配列番号69)
Y R C I T C E G C K G F F R R (配列番号70)
tacggactgctcacgtgtgagagctgcaagggcttcttcaagcgc (配列番号71)
Y G L L T C E S C K G F F K R (配列番号72)
tatgggctcctcacctgtgaaagctgcaagggattttttaagcga (配列番号73)
Y G L L T C E S C K G F F K R (配列番号74)

シグネチャーモチーフ：T C E G/S C K G

コンセンサス配列：
A-C-(A/C/G/T) T-G-T G-A-(A/G) (A/G)-G-(A/C) T-G-C A-A-G
T C E G/S C K
G-G(A/C/T)
G
複雑度：2³ x 3 x 4＝8 x 3 x 4＝96

変種８：４メンバー
tatggggtagtcacctgtggcagctgcaaagttttcttcaaaaga (配列番号75)
Y G V V T C G S C K V F F K R (配列番号76)
tatggagctctcacatgtggaagctgcaaggtcttcttcaaaaga (配列番号77)
Y G A L T C G S C K V F F K R (配列番号78)
tatggtgtccttacctgtgggagctgtaaggtcttctttaagagg (配列番号79)
Y G V L T C G S C K V F F K R (配列番号80)
tatggagtcttaacttgtggaagctgtaaagttttcttcaaaaga (配列番号81)
Y G V L T C G S C K V F F K R (配列番号82)

シグネチャーモチーフ：T C G S C K V

コンセンサス配列：
A-C-(A/C/T) T-G-T G-G-(A/C/G) A-G-C T-G-(C/T) A-A-(A/G)
T C G S C K
G-T-(C/T)
V
複雑度：2³ x 3²＝8 x 9＝72

変種９：４メンバー
tacggcgtggcctcctgcgaggcttgcaaggccttcttcaagagg (配列番号83)
Y G V A S C E A C K A F F K R (配列番号84)
tatggtgtggcatcctgtgaggcctgcaaagccttcttcaagagg (配列番号85)
Y G V A S C E A C K A F F K R (配列番号86)
tatggagtctggtcctgtgagggctgcaaggccttcttcaagaga (配列番号87)
Y G V W S C E G C K A F F K R (配列番号88)
tatggagtctggtcgtgtgaaggatgtaaggccttttttaaaaga (配列番号89)
Y G V W S C E G C K A F F K R (配列番号90)

シグネチャーモチーフ：S C E A/G C K A

コンセンサス配列：
T-C-(C/G) T-G-(C/T) G-A-(A/G) G-(C/G)-(A/C/T) T-G-(C/T)
S C E A/G C
A-A-(A/G) G-C-C
K A
複雑度：2⁶ x 3＝64 x 3＝192
ライブラリーの全体的複雑度：亜群１〜９の複雑度の合計＝1,664。

ライブラリーは、以下の半ランダム化オリゴヌクレオチドから構成される。
変種１(配列番号269)
5'-pCCAGGACGACAAAAAGACHTGYGARGGSTGYAARGGHCTTTTTAGGCTTTTCGG-3'
変種２(配列番号270)
5'-pCCAGGACGACAAAAAGWSYTGYGARGGBTGCAARGGNCTTTTTAGGCTTTTCGG-3'
変種３(配列番号271)
5'-pCCAGGACGACAAAAAGACSTGCGAGGGCTGCAARAGYCTTTTTAGGCTTTTCGG-3'
変種４(配列番号272)
5'-pCCAGGACGACAAAAAGCCTGCRACGGCTGCWSMGGYCTTTTTAGGCTTTTCGG-3'
変種５(配列番号273)
5'-pCCAGGACGACAAAAAGASCTGTGAYGGSTGCAAGGGYCTTTTTAGGCTTTTCGG-3'
変種６(配列番号274)
5'-pCCAGGACGACAAAAAGCNTGYGARGGVTGYAAGGGYCTTTTTAGGCTTTTCGG-3'
変種７(配列番号275)
5'-pCCAGGACGACAAAAAGACNTGTGARRGMTGCAAGGGHCTTTTTAGGCTTTTCGG-3'
変種８(配列番号276)
5'-pCCAGGACGACAAAAAGACHTGTGGVAGCTGYAARGTYCTTTTTAGGCTTTTCGG-3'
変種９(配列番号277)
5'-pCCAGGACGACAAAAAGTCSTGYGARGSHTGYAARGCCTTTTTAGGCTTTTCGG-3'

上記では、ヌクレオチドの混合物(ゆらぎ)は、以下の標準的命名法で表示される。
表２．

半ランダム化オリゴヌクレオチドをTE緩衝液内で再懸濁させ、その複雑度に正比例させて混ぜ合わせて最終濃度0.92μMにする。108pmolの半ランダム化オリゴヌクレオチド混合物をアダプターオリゴヌクレオチドUniv-1(FseI)及びUniv-2(AscI)それぞれ21.6pmolと混ぜ合わせる。
Univ-1(FseI): 5'-CTTTTTGTCGTCCTGGCCGG-3' (配列番号278)
Univ-2(AscI): 5'-pCGCGCCGAAAAGCCTAAAAAG-3' (配列番号279)
70℃で５分間加熱し、徐々に室温に冷ます(〜３時間)ことによってオリゴヌクレオチドをアニーリングさせる。アニールしたオリゴヌクレオチドを、対向するヒトU6及びマウスU6プロモーターを有する0.216pmolのFseI/AscI-消化ベクターに連結する。このベクターの構築は米国特許出願番号10/626,512に記載されている。TATAボックスと転写開始部位の間のヒトU6及びマウスU6プロモーターのヌクレオチド配列を修飾して、それぞれ以下に示すようにFseI及びAscIを含めた。
ヒトU6/マウスU6対向プロモーターカセット
(FseI及びAscI部位は小文字)：
GGATCCAAGCTTAAGGTCGGGCAGGAAGAGGGCCTATTTCCCATGATTCC
TTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTAGAATTA
ATTTGACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAG
TAATAATTTCTTGGGTAGTTTGCAGTTTTAAAATTATGTTTTAAAATGGA
CTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTAT
ATATCggccggccTCGAggcgcgccATATTTATAGTCTCAAAACACACAA
TTACTTTACAGTTAGGGTGAGTTTCCTTTTGTGCTGTTTTTTAAAATAAT
AATTTAGTATTTGTATCTCTTATAGAAATCCAAGCCTATCATGTAAAATG
TAGCTAGTATTAAAAAGAACAGATTATCTGTCTTTTATCGCACATTAAGC
CTCTATAGTTACTAGGAAATATTATATGCAAATTAACCGGGGCAGGGGAG
TAGCCGAGCTTCTCCCACAAGTCTGTGCGAGGGGGCCGGCGCGGGCCTAG
AGATGGCGGCGTCGGATCC (配列番号280)

16℃にて一晩、連結反応を行う。連結反応物の1/5を用いて電気受容性細菌(DH12S)を形質転換させて、10⁶〜10⁷cfu/μg DNAを得る。
相対的に低い複雑度(1,664)のため、96-ウェル様式で結果のライブラリーを一時的形質移入により宿主細胞に送達することが可能となる。約4,000の別個コロニーを選び、かつ2-mlのディープウェル96-ウェルプレート内(VWR)でウェル当たり750μlのTB培地(適切な抗生物質を含む)に接種することによってライブラリーを配列させる。20時間のインキュベーション後、培養を10群にプールする。プールした細菌培養1.5mlからDNAミニプレップ(Qiaprep Spin Miniprep Kits, Qiagen)を調製する。（各培養の残りを小分けし、後の使用のため冷凍する。）各プールから精製したDNAをRediplate 96 PicoGreen dsDNA Quantitation Kits(Molecular Probes)で定量する。各プールのDNAを100ng/μlに希釈し、96-ウェルプレート内で貯蔵する。各ウェルは、10個までの固有のsiRNAをコードするDNAを含有する。標準的方法を用いて96-ウェル様式で標的細胞のトランスフェクションを行う。

対向するpol IIIプロモーター(U6プロモーターを示してある)から発現させるための本発明の典型的DNA発現カセットを示す。

Claims

タンパク質ファミリーをコードする遺伝子の選択的転写後サイレンシング用のsiRNA発現ライブラリーの製造方法であって、
ｉ．前記タンパク質ファミリーのコンセンサス配列を同定する工程；及び
ii．siRNA発現ライブラリーであって、そのメンバーが、前記タンパク質ファミリーのすべての既知メンバーをコードする全mRNAを少なくとも標的にするsiRNA分子をコードする、前記siRNA発現ライブラリーを製造する工程、
を含む前記方法。
コンセンサス配列が15〜30個のヌクレオチドを含む、請求項１記載の方法。
コンセンサス配列が18〜24個のヌクレオチドを含む、請求項１記載の方法。
ライブラリーが50〜100万個の固有メンバーを含む、請求項１記載の方法。
ライブラリーが20,000〜100,000個の固有メンバーを含む、請求項１記載の方法。
タンパク質ファミリーが、Ｇタンパク質共役受容体、イオンチャンネル、受容体チロシンキナーゼ、非受容体チロシンキナーゼ、核ホルモン受容体、GTPアーゼ、ATPアーゼ、セリン／スレオニンキナーゼ、プロテアーゼ、マトリックスメタロプロテイナーゼ(MMPs)、GTPアーゼ活性化タンパク質(GAPs)及びE3ユビキチンリガーゼからなる群より選ばれる、請求項１記載の方法。
コンセンサス配列を同定する工程が、タンパク質ファミリーの少なくとも１つのシグネチャーモチーフを同定する工程を含む、請求項１記載の方法。
コンセンサス配列を同定する工程が、タンパク質ファミリーのシグネチャーモチーフの２つ以上の変種を同定する工程を含む、請求項１記載の方法。
タンパク質ファミリーをコードする遺伝子の選択的転写後サイレンシング用のsiRNA発現ライブラリーであって、前記ライブラリーのメンバーが、前記タンパク質ファミリーのすべての既知メンバーをコードする全mRNAを少なくとも標的にする15〜30ヌクレオチド長のsiRNA分子をコードしており、かつ100万個までの固有メンバーを含む、前記ライブラリー。
ライブラリーが100,000個までの固有メンバーを含む、請求項９記載のライブラリー。
タンパク質ファミリーが、Ｇタンパク質共役受容体、イオンチャンネル、受容体チロシンキナーゼ、非受容体チロシンキナーゼ、核ホルモン受容体、GTPアーゼ、ATPアーゼ、セリン／スレオニンキナーゼ、プロテアーゼ、マトリックスメタロプロテイナーゼ(MMP)、GTPアーゼ活性化タンパク質(GAP)及びE3ユビキチンリガーゼからなる群より選ばれる、請求項９記載のライブラリー。
siRNA分子が18〜24ヌクレオチド長である、請求項９記載のライブラリー。